LoslegenKostenlos starten

Subsetten

Denk daran: Das Unternehmen möchte sein Geschäft ausbauen und Hoppiness landesweit anbieten. Das Modell soll daher auch mit Daten aus neuen Filialen funktionieren. Eine Möglichkeit, zu prüfen, wie dein Modell auf neuen Daten performt, ist, es zunächst auf einem Teil der Daten zu trainieren und anschließend den verbleibenden Teil vorherzusagen.

Du erstellst einen Trainingsdatensatz, indem du den letzten erfassten Kauf pro Kunde zurückhältst. Das erreichst du mit der Funktion subset() auf choice.data, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 0 ist. Entsprechend erstellst du einen Testdatensatz, indem du alle Beobachtungen auswählst, bei denen die Indikatorvariable LASTPURCHASE gleich 1 ist.

Diese Übung ist Teil des Kurses

<Kurs>Response-Modelle in R erstellen</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lass den letzten Kauf weg, um einen Trainingsdatensatz zu erstellen. Verwende die Funktion subset() auf choice.data. Gib LASTPURCHASE == 0 als subset-Argument an. Weise das Ergebnis train.data zu.
  • Erstelle einen Testdatensatz, indem du die Funktion subset() auf choice.data verwendest. Gib LASTPURCHASE == 1 als subset-Argument an. Weise das Ergebnis test.data zu.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the training data


# Create the test data
Code bearbeiten und ausführen