Out-of-sample testen
Je doel is om aankooppredicties te maken voor nieuwe winkels op basis van je geschatte model. Je controleert of dit haalbaar is met de functie predict(). De functie predict() haalt de parameterinschattingen van train.model op om voorspellingen te doen over de responsvariabele in test.data. Om voorspelde waarden te krijgen op de schaal van de responsvariabele (de voorspelde aankoopkansen), moet je het extra argument type instellen op "response".
Tot slot worden de hold-out-voorspellingen geclassificeerd in aankopen en geen aankopen met de functie ifelse() en vergeleken met de geobserveerde aankopen met de functie table(). Ten slotte gebruik je de functie prop.table() om de aantallen in de tabel om te zetten naar relatieve aantallen.
Deze oefening maakt deel uit van de cursus
Responsmodellen bouwen in R
Oefeninstructies
- Voorspel de responsen voor
test.datamet de functiepredict()optrain.model. Zet het argumenttypeop"response"en noem het resultaatprobability. - Classificeer de modelvoorspellingen als
1als deprobabilitygroter is dan0.5en anders0. Wijs het resultaat toe aan een objectpredicted. - Haal de geobserveerde aankopen voor
HOPPINESSuittest.data. Wijs ze toe aan een objectobserved. - Kruistabelleer de gegevensvectoren
observedenpredictedmet de functiestable()enprop.table().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Predict the purchase probabilities for test.data
probability <- ___(___, ___, type = "response")
# Classify the predictions
predicted <- ___(probability >= ___, ___, ___)
# Obtain the observed purchases from test.data
observed <- test.data$HOPPINESS
# Cross-tabulate observed vs. predicted purchases
___(___(predicted, observed))