LoslegenKostenlos loslegen

Features erstellen

Du bist jetzt bestens gerüstet, um Recency-, Frequency-, Monetary-Value- und andere kundenspezifische Features für dein Regressionsmodell zu erstellen. Feature Engineering ist der wichtigste Schritt im Machine-Learning-Prozess. In dieser Übung erstellst du fünf kundenbezogene Features, die du anschließend zur Vorhersage der Transaktionen im nächsten Monat verwendest. Diese Features erfassen stark prädiktive Verhaltensmuster von Kundinnen und Kunden.

Die Bibliotheken pandas und numpy wurden als pd bzw. np geladen. Der Datensatz online_X wurde für dich importiert. Das datetime-Objekt NOW, das das Stichtagsdatum für die Berechnung der Recency darstellt, wurde ebenfalls für dich erstellt.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Berechne die Recency, indem du das aktuelle Datum vom letzten InvoiceDate abziehst.
  • Berechne die Frequency, indem du die eindeutige Anzahl an Rechnungen zählst.
  • Berechne den Monetary Value, indem du alle Ausgabenwerte summierst.
  • Berechne die durchschnittliche und die Gesamtmenge.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the snapshot date
NOW = dt.datetime(2011,11,1)

# Calculate recency by subtracting current date from the latest InvoiceDate
features = online_X.___('CustomerID').agg({
  'InvoiceDate': lambda x: (NOW - x.max()).days,
  # Calculate frequency by counting unique number of invoices
  'InvoiceNo': pd.Series.___,
  # Calculate monetary value by summing all spend values
  'TotalSum': np.___,
  # Calculate average and total quantity
  'Quantity': ['___', 'sum']}).reset_index()

# Rename the columns
features.columns = ['CustomerID', 'recency', 'frequency', 'monetary', 'quantity_avg', 'quantity_total']
Code bearbeiten und ausführen