Pré-processar dados de RFM
Carregamos o conjunto de dados com os valores de RFM que você calculou anteriormente como datamart_rfm. Como as variáveis estão assimétricas e em escalas diferentes, agora você vai corrigir a assimetria e normalizá-las.
A biblioteca pandas está carregada como pd, e numpy como np. Reserve um tempo para explorar o datamart_rfm no console.
Este exercício faz parte do curso
Segmentação de Clientes em Python
Instruções do exercício
- Aplique a transformação log para reduzir a assimetria de
datamart_rfme armazene comodatamart_log. - Inicialize uma instância
StandardScaler()comoscalere ajuste-a aos dados dedatamart_log. - Transforme os
dataescalando e centralizando-os com oscaler. - Crie um DataFrame do pandas a partir de 'datamart_normalized', adicionando o índice e os nomes das colunas de
datamart_rfm.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Unskew the data
datamart_log = np.____(____)
# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)
# Scale and center the data
datamart_normalized = ____.____(____)
# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)