Subsetten
Denk daran: Das Unternehmen möchte sein Geschäft ausbauen und Hoppiness landesweit anbieten. Das Modell soll daher auch mit Daten aus neuen Filialen funktionieren. Eine Möglichkeit, zu prüfen, wie dein Modell auf neuen Daten performt, ist, es zunächst auf einem Teil der Daten zu trainieren und anschließend den verbleibenden Teil vorherzusagen.
Du erstellst einen Trainingsdatensatz, indem du den letzten erfassten Kauf pro Kunde zurückhältst. Das erreichst du mit der Funktion subset() auf choice.data, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 0 ist. Entsprechend erstellst du einen Testdatensatz, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 1 ist.
Diese Übung ist Teil des Kurses
Response-Modelle in R erstellen
Anleitung zur Übung
- Lass den letzten Kauf weg, um einen Trainingsdatensatz zu erstellen. Verwende die Funktion
subset()aufchoice.data. GibLASTPURCHASE == 0alssubset-Argument an. Weise das Ergebnistrain.datazu. - Erstelle einen Testdatensatz, indem du die Funktion
subset()aufchoice.dataverwendest. GibLASTPURCHASE == 1alssubset-Argument an. Weise das Ergebnistest.datazu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the training data
# Create the test data