1. Apprendre
  2. /
  3. Cours
  4. /
  5. Machine Learning avec des modèles à base d'arbres en Python

Connected

Exercice

Biais élevé ou variance élevée ?

Dans cet exercice, vous allez déterminer si l'arbre de régression dt que vous avez entraîné à l'exercice précédent souffre d'un problème de biais ou de variance.

Le RMSE sur l'ensemble d'entraînement (RMSE_train) et le RMSE en CV (RMSE_CV) obtenus par dt sont disponibles dans votre espace de travail. De plus, nous avons aussi chargé une variable appelée baseline_RMSE, qui correspond à la racine de l'erreur quadratique moyenne obtenue par l'arbre de régression entraîné avec seulement la variable explicative disp (il s'agit du RMSE obtenu par l'arbre de régression entraîné au chapitre 1, leçon 3). Ici, baseline_RMSE sert de valeur de référence : au‑dessus, on considère que le modèle sous-ajuste; en dessous, on le juge « suffisant ».

Est-ce que dt souffre d'un biais élevé ou d'une variance élevée ?

Instructions

50 XP

Réponses possibles