Biais élevé ou variance élevée ?
Dans cet exercice, vous déterminerez si l' dt d'arbre de régression que vous avez entraînée dans l'exercice précédent présente un problème de biais ou de variance.
L'erreur quadratique moyenne (RMSE) de l'ensemble d'apprentissage (RMSE_train) et l'erreur quadratique moyenne (RMSE) de la validation croisée (RMSE_CV) obtenues par dt sont disponibles dans votre espace de travail. De plus, nous avons également chargé une variable appelée baseline_RMSE qui correspond à l'erreur quadratique moyenne obtenue par l'arbre de régression formé uniquement avec la caractéristique disp (il s'agit de l'erreur quadratique moyenne obtenue par l'arbre de régression formé au chapitre 1, leçon 3). baseline_RMSE Ici, l'erreur quadratique moyenne (RMSE) sert de référence : au-dessus de cette valeur, le modèle est considéré comme sous-ajusté, tandis qu'en dessous, il est jugé « suffisamment bon ».
dt souffre-t-il d'un problème de biais élevé ou de variance élevée ?
Cet exercice fait partie du cours
Machine learning avec des modèles arborescents en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice