ComenzarEmpieza gratis

Construye características

Ahora ya estás listo para crear recencia, frecuencia, valor monetario y otras características a nivel de cliente para tu modelo de regresión. La ingeniería de características es el paso más importante en el proceso de Machine Learning. En este ejercicio crearás cinco características a nivel de cliente que usarás para predecir las transacciones del próximo mes. Estas características recogen patrones de comportamiento del cliente con gran poder predictivo.

Las librerías pandas y numpy se han cargado como pd y np, respectivamente. El conjunto de datos online_X ya está importado. También se ha creado para ti el objeto datetime NOW, que representa la fecha de corte que usarás para calcular la recencia.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

  • Calcula la recencia restando la fecha actual de la última InvoiceDate.
  • Calcula la frecuencia contando el número único de facturas.
  • Calcula el valor monetario sumando todos los importes gastados.
  • Calcula la cantidad media y total.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Define the snapshot date
NOW = dt.datetime(2011,11,1)

# Calculate recency by subtracting current date from the latest InvoiceDate
features = online_X.___('CustomerID').agg({
  'InvoiceDate': lambda x: (NOW - x.max()).days,
  # Calculate frequency by counting unique number of invoices
  'InvoiceNo': pd.Series.___,
  # Calculate monetary value by summing all spend values
  'TotalSum': np.___,
  # Calculate average and total quantity
  'Quantity': ['___', 'sum']}).reset_index()

# Rename the columns
features.columns = ['CustomerID', 'recency', 'frequency', 'monetary', 'quantity_avg', 'quantity_total']
Editar y ejecutar código