Aan de slagGa gratis aan de slag

De folds fitten

Nu je de data in folds hebt gesplitst, is het tijd om ze te gebruiken voor het trainen van het model en het berekenen van de out-of-sample fout van elk afzonderlijk model. Zo krijg je een evenwichtige inschatting van de prestaties van je modelspecificatie, omdat je die meerdere keren out-of-sample hebt geëvalueerd.

In je werkruimte staat chocolate_folds, dat je in de vorige oefening hebt gemaakt (10 folds van de chocolade-trainingsset).

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Laat zien dat je het nog steeds kunt: maak tree_spec, een regressieboom-specificatie met een "rpart"-engine.
  • Gebruik fit_resamples() om je folds te fitten met tree_spec, modelleer final_grade met alle andere voorspellers en evalueer met zowel MAE als RMSE.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a specification
tree_spec <- ___ %>%
    ___
    ___

# Fit all folds to the specification
fits_cv <- ___(tree_spec,
               ___,
               resamples = ___,
               metrics = ___)

fits_cv
Code bewerken en uitvoeren