Preparare i dati per la market basket analysis
In tutto il corso, incontrerai i dati in uno dei due formati: un DataFrame pandas o una lista di liste. Gli oggetti DataFrame verranno creati importando un file csv con pandas. Saranno composti da una singola colonna di dati, in cui ogni elemento contiene una stringa di articoli presenti in una transazione, separati da virgole, come nella tabella seguente.
In questo esercizio, farai pratica a caricare i dati da un file csv e a prepararli per l'uso come lista di liste. Nota che il percorso del dataset del negozio di alimentari è già definito ed è disponibile come groceries_path.
| Transaction |
|---|
| 'milk,bread,biscuit' |
| 'bread,milk,biscuit,cereal' |
| … |
| 'tea,milk,coffee,cereal' |
Questo esercizio fa parte del corso
Analisi del carrello in Python
Istruzioni dell'esercizio
- Importa il pacchetto
pandascon l'aliaspd. - Usa pandas per leggere il file csv al percorso specificato da
groceries_path. - Seleziona la colonna
Transactiondal DataFrame e dividi ogni stringa di articoli separati da virgole in una lista. - Converte il DataFrame di transazioni in una lista di liste.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas under the alias pd
import ____ as pd
# Load transactions from pandas
groceries = pd.____(groceries_path)
# Split transaction strings into lists
transactions = groceries['____'].apply(lambda t: t.split(','))
# Convert DataFrame column into list of strings
transactions = list(____)
# Print the list of transactions
print(transactions)