Daten für Market Basket Analysis vorbereiten
In diesem Kurs wirst du Daten in der Regel in einem von zwei Formaten sehen: als pandas-DataFrame oder als Liste von Listen. DataFrame-Objekte werden erstellt, indem eine CSV-Datei mit pandas importiert wird. Sie bestehen aus einer einzigen Datenspalte, in der jedes Element eine durch Kommas getrennte Zeichenkette mit Artikeln einer Transaktion enthält – wie in der Tabelle unten.
In dieser Übung lädst du die Daten aus einer CSV-Datei und bereitest sie als Liste von Listen auf. Beachte, dass der Pfad zum Datensatz des Lebensmittelgeschäfts bereits definiert ist und dir als groceries_path zur Verfügung steht.
| Transaction |
|---|
| 'milk,bread,biscuit' |
| 'bread,milk,biscuit,cereal' |
| … |
| 'tea,milk,coffee,cereal' |
Diese Übung ist Teil des Kurses
Market Basket Analysis in Python
Anleitung zur Übung
- Importiere das Paket
pandasmit dem Aliaspd. - Verwende pandas, um die CSV-Datei am Pfad in
groceries_patheinzulesen. - Wähle die Spalte
Transactionaus dem DataFrame und teile jede durch Kommas getrennte Zeichenkette in eine Liste auf. - Wandle den DataFrame mit den Transaktionen in eine Liste von Listen um.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas under the alias pd
import ____ as pd
# Load transactions from pandas
groceries = pd.____(groceries_path)
# Split transaction strings into lists
transactions = groceries['____'].apply(lambda t: t.split(','))
# Convert DataFrame column into list of strings
transactions = list(____)
# Print the list of transactions
print(transactions)