LoslegenKostenlos loslegen

Daten für Market Basket Analysis vorbereiten

In diesem Kurs wirst du Daten in der Regel in einem von zwei Formaten sehen: als pandas-DataFrame oder als Liste von Listen. DataFrame-Objekte werden erstellt, indem eine CSV-Datei mit pandas importiert wird. Sie bestehen aus einer einzigen Datenspalte, in der jedes Element eine durch Kommas getrennte Zeichenkette mit Artikeln einer Transaktion enthält – wie in der Tabelle unten.

In dieser Übung lädst du die Daten aus einer CSV-Datei und bereitest sie als Liste von Listen auf. Beachte, dass der Pfad zum Datensatz des Lebensmittelgeschäfts bereits definiert ist und dir als groceries_path zur Verfügung steht.

Transaction
'milk,bread,biscuit'
'bread,milk,biscuit,cereal'
'tea,milk,coffee,cereal'

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere das Paket pandas mit dem Alias pd.
  • Verwende pandas, um die CSV-Datei am Pfad in groceries_path einzulesen.
  • Wähle die Spalte Transaction aus dem DataFrame und teile jede durch Kommas getrennte Zeichenkette in eine Liste auf.
  • Wandle den DataFrame mit den Transaktionen in eine Liste von Listen um.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import pandas under the alias pd
import ____ as pd

# Load transactions from pandas
groceries = pd.____(groceries_path)

# Split transaction strings into lists
transactions = groceries['____'].apply(lambda t: t.split(','))

# Convert DataFrame column into list of strings
transactions = list(____)

# Print the list of transactions
print(transactions)
Code bearbeiten und ausführen