Pré-processar dados
O primeiro passo no processo de segmentação é pré-processar os dados. Você vai aplicar a transformação logarítmica e, em seguida, normalizar os dados para prepará-los para o clustering.
Carregamos o conjunto de dados com os valores de RFMT como datamart_rfmt. Além disso, a biblioteca pandas está carregada como pd e numpy como np.
Sinta-se à vontade para explorar o conjunto de dados RFMT expandido no console.
Este exercício faz parte do curso
Segmentação de Clientes em Python
Instruções do exercício
- Importe StandardScaler, inicialize-o e armazene como
scaler. - Aplique a transformação logarítmica aos dados RFMT brutos.
- Inicialize o scaler e ajuste-o aos dados transformados em log.
- Transforme e armazene os dados escalonados como
datamart_rfmt_normalized.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import StandardScaler
from ____.____ import ____
# Apply log transformation
datamart_rfmt_log = ____.____(____)
# Initialize StandardScaler and fit it
scaler = ____(); ____.fit(____)
# Transform and store the scaled data as datamart_rfmt_normalized
datamart_rfmt_normalized = ____.____(____)