LoslegenKostenlos loslegen

Subsetten

Denk daran: Das Unternehmen möchte sein Geschäft ausbauen und Hoppiness landesweit anbieten. Das Modell soll daher auch mit Daten aus neuen Filialen funktionieren. Eine Möglichkeit, zu prüfen, wie dein Modell auf neuen Daten performt, ist, es zunächst auf einem Teil der Daten zu trainieren und anschließend den verbleibenden Teil vorherzusagen.

Du erstellst einen Trainingsdatensatz, indem du den letzten erfassten Kauf pro Kunde zurückhältst. Das erreichst du mit der Funktion subset() auf choice.data, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 0 ist. Entsprechend erstellst du einen Testdatensatz, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 1 ist.

Diese Übung ist Teil des Kurses

Response-Modelle in R erstellen

Kurs anzeigen

Anleitung zur Übung

  • Lass den letzten Kauf weg, um einen Trainingsdatensatz zu erstellen. Verwende die Funktion subset() auf choice.data. Gib LASTPURCHASE == 0 als subset-Argument an. Weise das Ergebnis train.data zu.
  • Erstelle einen Testdatensatz, indem du die Funktion subset() auf choice.data verwendest. Gib LASTPURCHASE == 1 als subset-Argument an. Weise das Ergebnis test.data zu.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the training data


# Create the test data
Code bearbeiten und ausführen