LoslegenKostenlos loslegen

Zielvariable definieren

Hier erstellst du eine pandas-Pivot-Tabelle mit Kund:innen als Zeilen, Rechnungsmonaten als Spalten und der Anzahl der Rechnungen als Werten. Du verwendest den Wert des letzten Monats als Zielvariable. Die übrigen Variablen können im Modell als sogenannte verzögerte Features (lagged features) verwendet werden. Du wirst sie hier nicht nutzen, wir empfehlen dir aber ausdrücklich zu prüfen, ob das Hinzufügen dieser Variablen die Modellleistung über das hinaus verbessert, was du in den nächsten Übungen sehen wirst.

Die Bibliotheken pandas und numpy sind bereits als pd bzw. np geladen. Der Datensatz online wurde für dich importiert.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Pivot-Tabelle mit der Funktion pivot_table() und zähle die Rechnungen.
  • Speichere den Spaltennamen der Verkaufsdaten für November 2011 als Liste.
  • Speichere den Zielwert als Y.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Code bearbeiten und ausführen