Out-of-sample-Testing
Dein Ziel ist es, Kaufvorhersagen für neue Stores auf Basis deines geschätzten Modells zu treffen. Du prüfst, ob dieses Ziel realistisch ist, indem du die Funktion predict() verwendest. Die Funktion predict() ruft die Parameterschätzungen von train.model ab, um Vorhersagen für die Zielvariable in test.data zu erstellen. Um vorhergesagte Werte auf der Skala der Zielvariable zu erhalten (die vorhergesagten Kaufwahrscheinlichkeiten), musst du das zusätzliche Argument type auf "response" setzen.
Anschließend werden die Holdout-Vorhersagen mit der Funktion ifelse() in Käufe und Nicht-Käufe klassifiziert und mithilfe der Funktion table() mit den beobachteten Käufen verglichen. Abschließend verwendest du die Funktion prop.table(), um die Zahlen in der Tabelle in relative Werte umzuwandeln.
Diese Übung ist Teil des Kurses
Response-Modelle in R erstellen
Anleitung zur Übung
- Sage die Antworten für
test.datavoraus, indem du die Funktionpredict()auftrain.modelanwendest. Setze das Argumenttypeauf"response"und nenne das Ergebnisprobability. - Klassifiziere die Modellvorhersagen als
1, wennprobabilitygrößer als0.5ist, andernfalls als0. Weise das Ergebnis einem Objektpredictedzu. - Ermittle die beobachteten Käufe für
HOPPINESSaustest.data. Weise sie einem Objektobservedzu. - Kreuztabelle die Vektoren
observedundpredictedmithilfe der Funktionentable()undprop.table().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Predict the purchase probabilities for test.data
probability <- ___(___, ___, type = "response")
# Classify the predictions
predicted <- ___(probability >= ___, ___, ___)
# Obtain the observed purchases from test.data
observed <- test.data$HOPPINESS
# Cross-tabulate observed vs. predicted purchases
___(___(predicted, observed))