Eseguire l'aggregazione
Dopo alcuni piccoli incarichi di consulenza per una biblioteca e un venditore di ebook, hai finalmente ricevuto il tuo primo grande progetto di Market Basket Analysis: consigliare un rivenditore online di regali originali sulle cross‑promotions. Poiché il rivenditore non ha mai assunto prima un data scientist, vorrebbe che iniziassi esplorando i suoi dati di transazione. Ti ha chiesto di eseguire l'aggregazione per tutti i signs nel dataset e di calcolare anche il supporto per questa categoria. Nota che pandas è già stato importato come pd. Inoltre, i dati sono stati importati in formato one‑hot encoded come onehot.
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Seleziona il sottoinsieme delle colonne del DataFrame che contengono la stringa
sign. - Stampa il supporto per
signs.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())