Definisci la variabile target
Qui costruirai una pivot table di pandas con i clienti come righe, i mesi delle fatture come colonne e il numero di fatture come valori. Userai il valore dell’ultimo mese come variabile target. Le restanti variabili possono essere usate come cosiddette caratteristiche ritardate (lagged features) nel modello. Non le userai in questo esercizio, ma ti consigliamo vivamente di verificare se aggiungerle migliora le prestazioni del modello rispetto a ciò che vedrai nei prossimi esercizi.
Le librerie pandas e numpy sono state caricate rispettivamente come pd e np. Il dataset online è già stato importato per te.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Crea una pivot table usando la funzione
pivot_table()contando le fatture. - Salva il nome della colonna dei dati di vendita di novembre 2011 come una lista.
- Salva il valore target come
Y.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
index=['___'], columns=['___'],
aggfunc=pd.Series.nunique, fill_value=0)
# Store November 2011 data column name as a list
target = ['2011-___']
# Store target value as `Y`
Y = cust_month_tx[___]