ComeçarComece de graça

Criar variáveis

Agora você está pronto para construir recência, frequência, valor monetário e outras variáveis em nível de cliente para o seu modelo de regressão. A engenharia de atributos é a etapa mais importante no processo de Machine Learning. Neste exercício, você vai criar cinco variáveis por cliente que depois serão usadas para prever as transações do próximo mês. Essas variáveis capturam padrões de comportamento do cliente com alto poder preditivo.

As bibliotecas pandas e numpy já foram carregadas como pd e np, respectivamente. O conjunto de dados online_X foi importado para você. O objeto datetime NOW, que representa a data de referência que você usará para calcular a recência, também já foi criado.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Calcule a recência subtraindo a data atual da última InvoiceDate.
  • Calcule a frequência contando o número único de faturas.
  • Calcule o valor monetário somando todos os valores gastos.
  • Calcule a quantidade média e total.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define the snapshot date
NOW = dt.datetime(2011,11,1)

# Calculate recency by subtracting current date from the latest InvoiceDate
features = online_X.___('CustomerID').agg({
  'InvoiceDate': lambda x: (NOW - x.max()).days,
  # Calculate frequency by counting unique number of invoices
  'InvoiceNo': pd.Series.___,
  # Calculate monetary value by summing all spend values
  'TotalSum': np.___,
  # Calculate average and total quantity
  'Quantity': ['___', 'sum']}).reset_index()

# Rename the columns
features.columns = ['CustomerID', 'recency', 'frequency', 'monetary', 'quantity_avg', 'quantity_total']
Editar e executar o código