¿Alto sesgo o alta varianza?
En este ejercicio diagnosticarás si el árbol de regresión dt
que entrenaste en el ejercicio anterior sufre un problema de sesgo o de varianza.
El conjunto de entrenamiento RMSE (RMSE_train
) y el CV RMSE (RMSE_CV
) alcanzado por dt
están disponibles en tu espacio de trabajo. Además, también hemos cargado una variable llamada baseline_RMSE
que corresponde al error cuadrático medio obtenido por el árbol de regresión entrenado solo con la característica disp
(es el RMSE obtenido por el árbol de regresión entrenado en el capítulo 1, lección 3). Aquí baseline_RMSE
sirve como línea de base RMSE por encima de la cual se considera que un modelo no se ajusta lo suficiente y por debajo de la cual se considera que el modelo es "suficientemente bueno".
¿Padece dt
un problema de alto sesgo o de alta varianza?
Este ejercicio forma parte del curso
Machine learning con modelos basados en árboles en Python
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
