Evalueer de folds
Nu je 10 modellen hebt getraind met al je 10 folds en voor elk model de MAE en RMSE hebt berekend, is het tijd om te visualiseren hoe groot de fouten zijn. Zo bouw je gevoel op voor de out-of-sample foutverdeling, wat helpt om de kwaliteit van je model te beoordelen.
Je plot al deze fouten als een histogram en toont de samenvattende statistieken over alle folds.
Het resultaat van de vorige oefening, fits_cv, is voor je geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Verzamel de out-of-sample fouten van alle modellen in
fits_cvmet één enkeleyardstick-functie en sla ze op alsall_errors. - Maak een
ggplot2-histogram met.estimateals dex-esthetiek envulde balken op basis van.metric. - Gebruik dezelfde functie als in de eerste instructie met
summarize = TRUEom samenvattende statistieken vanfits_cvte tonen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(ggplot2)
# Collect the errors
all_errors <- ___(___, summarize = ___)
# Plot an error histogram
ggplot(___, aes(___, ___)) +
___()
# Collect and print error statistics
___(fits_cv, ___)