Definir la variable objetivo
Aquí vas a crear una tabla dinámica de pandas con clientes como filas, meses de factura como columnas y el número de facturas como valores. Usarás el valor del último mes como variable objetivo. El resto de variables se pueden usar como las llamadas características rezagadas en el modelo. No las usarás ahora, pero te animamos a comprobar si añadir estas variables mejora el rendimiento de tu modelo más allá de lo que verás en los próximos ejercicios.
Las librerías pandas y numpy se han cargado como pd y np, respectivamente. El conjunto de datos online ya se ha importado.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Crea una tabla dinámica con la función
pivot_table()contando las facturas. - Guarda el nombre de la columna de ventas de noviembre de 2011 como una lista.
- Guarda el valor objetivo como
Y.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
index=['___'], columns=['___'],
aggfunc=pd.Series.nunique, fill_value=0)
# Store November 2011 data column name as a list
target = ['2011-___']
# Store target value as `Y`
Y = cust_month_tx[___]