Aan de slagBegin gratis

Prestaties in-sample en out-of-sample

Presteert een geavanceerder model altijd beter? Zoals we in de video bespraken, is dat maar half waar.

Overfitte modellen begrijpen de structuur van hun trainingsset perfect, maar kunnen niet generaliseren naar nieuwe data. Dat is balen! Uiteindelijk is het hoofddoel van een voorspellend model toch om goed te presteren op nieuwe data? Ga het onderzoeken!

Vooraf geladen zijn het laatste model uit de vorige oefening, complex_model, en je trainings- en testdata (chocolate_train en chocolate_test).

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Predict on and combine with training data and calculate the error
predict(___, new_data = ___) %>%
	___ %>% 
	mae(___,
        ___)
Code bewerken en uitvoeren