ComeçarComece de graça

Pré-processar dados de RFM

Carregamos o conjunto de dados com os valores de RFM que você calculou anteriormente como datamart_rfm. Como as variáveis estão assimétricas e em escalas diferentes, agora você vai corrigir a assimetria e normalizá-las.

A biblioteca pandas está carregada como pd, e numpy como np. Reserve um tempo para explorar o datamart_rfm no console.

Este exercício faz parte do curso

Segmentação de Clientes em Python

Ver curso

Instruções do exercício

  • Aplique a transformação log para reduzir a assimetria de datamart_rfm e armazene como datamart_log.
  • Inicialize uma instância StandardScaler() como scaler e ajuste-a aos dados de datamart_log.
  • Transforme os data escalando e centralizando-os com o scaler.
  • Crie um DataFrame do pandas a partir de 'datamart_normalized', adicionando o índice e os nomes das colunas de datamart_rfm.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Unskew the data
datamart_log = np.____(____)

# Initialize a standard scaler and fit it
scaler = ____()
scaler.____(____)

# Scale and center the data
datamart_normalized = ____.____(____)

# Create a pandas DataFrame
datamart_normalized = pd.____(data=____, index=____.index, columns=____.columns)
Editar e executar o código