LoslegenKostenlos starten

Zielvariable definieren

Hier erstellst du eine pandas-Pivot-Tabelle mit Kund:innen als Zeilen, Rechnungsmonaten als Spalten und der Anzahl der Rechnungen als Werten. Du verwendest den Wert des letzten Monats als Zielvariable. Die übrigen Variablen können im Modell als sogenannte verzögerte Features (lagged features) verwendet werden. Du wirst sie hier nicht nutzen, wir empfehlen dir aber ausdrücklich zu prüfen, ob das Hinzufügen dieser Variablen die Modellleistung über das hinaus verbessert, was du in den nächsten Übungen sehen wirst.

Die Bibliotheken pandas und numpy sind bereits als pd bzw. np geladen. Der Datensatz online wurde für dich importiert.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle eine Pivot-Tabelle mit der Funktion pivot_table() und zähle die Rechnungen.
  • Speichere den Spaltennamen der Verkaufsdaten für November 2011 als Liste.
  • Speichere den Zielwert als Y.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Code bearbeiten und ausführen