Evalúa los pliegues
Ahora que ajustaste 10 modelos usando tus 10 pliegues y calculaste el MAE y el RMSE de cada uno, es hora de visualizar el tamaño de los errores. Así podrás formarte una intuición sobre la distribución del error fuera de muestra, lo que ayuda a evaluar la calidad de tu modelo.
Vas a representar todos estos errores en un histograma y mostrar las estadísticas resumidas a través de todos los pliegues.
El resultado del ejercicio anterior, fits_cv, está precargado.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Recopila los errores fuera de muestra de todos los modelos de
fits_cvusando una única función deyardsticky guárdalos comoall_errors. - Crea un histograma con
ggplot2usando.estimatecomo estéticaxy colorea (fill) las barras según.metric. - Usa la misma función que en la primera instrucción con
summarize = TRUEpara mostrar estadísticas resumidas defits_cv.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(ggplot2)
# Collect the errors
all_errors <- ___(___, summarize = ___)
# Plot an error histogram
ggplot(___, aes(___, ___)) +
___()
# Collect and print error statistics
___(fits_cv, ___)