Valuta le fold
Ora che hai addestrato 10 modelli usando tutte e 10 le tue fold e calcolato MAE e RMSE per ciascuno di questi modelli, è il momento di visualizzare l’entità degli errori. In questo modo sviluppi un’intuizione sulla distribuzione dell’errore out-of-sample, utile per valutare la qualità del modello.
Rappresenterai tutti questi errori con un istogramma e mostrerai le statistiche riassuntive su tutte le fold.
Il risultato dell’esercizio precedente, fits_cv, è già caricato.
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Istruzioni dell'esercizio
- Raccogli gli errori out-of-sample di tutti i modelli in
fits_cvusando un’unica funzione diyardsticke salvali comeall_errors. - Crea un istogramma
ggplot2usando.estimatecome esteticaxefilldelle barre impostato su.metric. - Usa la stessa funzione della prima istruzione con
summarize = TRUEper mostrare le statistiche riassuntive difits_cv.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(ggplot2)
# Collect the errors
all_errors <- ___(___, summarize = ___)
# Plot an error histogram
ggplot(___, aes(___, ___)) +
___()
# Collect and print error statistics
___(fits_cv, ___)