Subsetten
Denk daran: Das Unternehmen möchte sein Geschäft ausbauen und Hoppiness landesweit anbieten. Das Modell soll daher auch mit Daten aus neuen Filialen funktionieren. Eine Möglichkeit, zu prüfen, wie dein Modell auf neuen Daten performt, ist, es zunächst auf einem Teil der Daten zu trainieren und anschließend den verbleibenden Teil vorherzusagen.
Du erstellst einen Trainingsdatensatz, indem du den letzten erfassten Kauf pro Kunde zurückhältst. Das erreichst du mit der Funktion subset() auf choice.data, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 0 ist. Entsprechend erstellst du einen Testdatensatz, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 1 ist.
Diese Übung ist Teil des Kurses
<Kurs>Response-Modelle in R erstellen</Kurs>Übungsanweisungen
- Lass den letzten Kauf weg, um einen Trainingsdatensatz zu erstellen. Verwende die Funktion
subset()aufchoice.data. GibLASTPURCHASE == 0alssubset-Argument an. Weise das Ergebnistrain.datazu. - Erstelle einen Testdatensatz, indem du die Funktion
subset()aufchoice.dataverwendest. GibLASTPURCHASE == 1alssubset-Argument an. Weise das Ergebnistest.datazu.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create the training data
# Create the test data