Prestaties in-sample en out-of-sample
Presteert een geavanceerder model altijd beter? Zoals we in de video bespraken, is dat maar half waar.
Overfitte modellen begrijpen de structuur van hun trainingsset perfect, maar kunnen niet generaliseren naar nieuwe data. Dat is balen! Uiteindelijk is het hoofddoel van een voorspellend model toch om goed te presteren op nieuwe data? Ga het onderzoeken!
Vooraf geladen zijn het laatste model uit de vorige oefening, complex_model, en je trainings- en testdata (chocolate_train en chocolate_test).
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Predict on and combine with training data and calculate the error
predict(___, new_data = ___) %>%
___ %>%
mae(___,
___)