IniziaInizia gratis

Preparare i dati per la market basket analysis

In tutto il corso, incontrerai i dati in uno dei due formati: un DataFrame pandas o una lista di liste. Gli oggetti DataFrame verranno creati importando un file csv con pandas. Saranno composti da una singola colonna di dati, in cui ogni elemento contiene una stringa di articoli presenti in una transazione, separati da virgole, come nella tabella seguente.

In questo esercizio, farai pratica a caricare i dati da un file csv e a prepararli per l'uso come lista di liste. Nota che il percorso del dataset del negozio di alimentari è già definito ed è disponibile come groceries_path.

Transaction
'milk,bread,biscuit'
'bread,milk,biscuit,cereal'
'tea,milk,coffee,cereal'

Questo esercizio fa parte del corso

Analisi del carrello in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa il pacchetto pandas con l'alias pd.
  • Usa pandas per leggere il file csv al percorso specificato da groceries_path.
  • Seleziona la colonna Transaction dal DataFrame e dividi ogni stringa di articoli separati da virgole in una lista.
  • Converte il DataFrame di transazioni in una lista di liste.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import pandas under the alias pd
import ____ as pd

# Load transactions from pandas
groceries = pd.____(groceries_path)

# Split transaction strings into lists
transactions = groceries['____'].apply(lambda t: t.split(','))

# Convert DataFrame column into list of strings
transactions = list(____)

# Print the list of transactions
print(transactions)
Modifica ed esegui il codice