Biais élevé ou variance élevée ?
Dans cet exercice, vous allez diagnostiquer si l'arbre de régression dt
que vous avez formé dans l'exercice précédent souffre d'un problème de biais ou de variance.
L'ensemble d'apprentissage RMSE (RMSE_train
) et l'ensemble CV RMSE (RMSE_CV
) obtenu par dt
sont disponibles dans votre espace de travail. En outre, nous avons également chargé une variable appelée baseline_RMSE
qui correspond à l'erreur quadratique moyenne obtenue par l'arbre de régression formé avec la caractéristique disp
uniquement (il s'agit de la valeur RMSE obtenue par l'arbre de régression formé au chapitre 1, leçon 3). Ici, baseline_RMSE
sert de référence RMSE au-delà de laquelle un modèle est considéré comme sous-adapté et en deçà de laquelle le modèle est considéré comme "suffisamment bon".
Le site dt
souffre-t-il d'un problème de biais élevé ou de variance élevée ?
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
