Aan de slagGa gratis aan de slag

Out-of-sample testen

Je doel is om aankooppredicties te maken voor nieuwe winkels op basis van je geschatte model. Je controleert of dit haalbaar is met de functie predict(). De functie predict() haalt de parameterinschattingen van train.model op om voorspellingen te doen over de responsvariabele in test.data. Om voorspelde waarden te krijgen op de schaal van de responsvariabele (de voorspelde aankoopkansen), moet je het extra argument type instellen op "response".

Tot slot worden de hold-out-voorspellingen geclassificeerd in aankopen en geen aankopen met de functie ifelse() en vergeleken met de geobserveerde aankopen met de functie table(). Ten slotte gebruik je de functie prop.table() om de aantallen in de tabel om te zetten naar relatieve aantallen.

Deze oefening maakt deel uit van de cursus

Responsmodellen bouwen in R

Cursus bekijken

Oefeninstructies

  • Voorspel de responsen voor test.data met de functie predict() op train.model. Zet het argument type op "response" en noem het resultaat probability.
  • Classificeer de modelvoorspellingen als 1 als de probability groter is dan 0.5 en anders 0. Wijs het resultaat toe aan een object predicted.
  • Haal de geobserveerde aankopen voor HOPPINESS uit test.data. Wijs ze toe aan een object observed.
  • Kruistabelleer de gegevensvectoren observed en predicted met de functies table() en prop.table().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Predict the purchase probabilities for test.data
probability <- ___(___, ___, type = "response") 

# Classify the predictions
predicted <- ___(probability >= ___, ___, ___) 

# Obtain the observed purchases from test.data
observed <- test.data$HOPPINESS

# Cross-tabulate observed vs. predicted purchases
___(___(predicted, observed))
Code bewerken en uitvoeren