Pré-processar dados de RFM

Carregamos o conjunto de dados com os valores de RFM que você calculou anteriormente como datamart_rfm. Como as variáveis estão assimétricas e em escalas diferentes, agora você vai corrigir a assimetria e normalizá-las.

A biblioteca pandas está carregada como pd, e numpy como np. Reserve um tempo para explorar o datamart_rfm no console.

Este exercicio faz parte do curso

Segmentação de Clientes em Python

Ver curso

Instruções do exercicio

Aplique a transformação log para reduzir a assimetria de datamart_rfm e armazene como datamart_log.
Inicialize uma instância StandardScaler() como scaler e ajuste-a aos dados de datamart_log.
Transforme os data escalando e centralizando-os com o scaler.
Crie um DataFrame do pandas a partir de 'datamart_normalized', adicionando o índice e os nomes das colunas de datamart_rfm.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Unskew the data
datamart_log = np.____(____)

# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)

# Scale and center the data
datamart_normalized = ____.____(____)

# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)

Editar e Executar Código