Aan de slagGa gratis aan de slag

Evalueer de folds

Nu je 10 modellen hebt getraind met al je 10 folds en voor elk model de MAE en RMSE hebt berekend, is het tijd om te visualiseren hoe groot de fouten zijn. Zo bouw je gevoel op voor de out-of-sample foutverdeling, wat helpt om de kwaliteit van je model te beoordelen.

Je plot al deze fouten als een histogram en toont de samenvattende statistieken over alle folds.

Het resultaat van de vorige oefening, fits_cv, is voor je geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Verzamel de out-of-sample fouten van alle modellen in fits_cv met één enkele yardstick-functie en sla ze op als all_errors.
  • Maak een ggplot2-histogram met .estimate als de x-esthetiek en vul de balken op basis van .metric.
  • Gebruik dezelfde functie als in de eerste instructie met summarize = TRUE om samenvattende statistieken van fits_cv te tonen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

library(ggplot2)

# Collect the errors
all_errors <- ___(___, summarize = ___)

# Plot an error histogram
ggplot(___, aes(___, ___)) +
        ___()

# Collect and print error statistics
___(fits_cv, ___)
Code bewerken en uitvoeren