CommencerCommencer gratuitement

Instancier le modèle

Dans la série d'exercices suivante, vous diagnostiquerez les problèmes de biais et de variance d'un arbre de régression. L'arbre de régression que vous allez définir dans cet exercice sera utilisé pour prédire la consommation en miles par gallon (mpg) des voitures à partir de l'ensemble de données auto en utilisant toutes les caractéristiques disponibles.

Nous avons déjà traité les données et chargé la matrice des caractéristiques X et le tableau y dans votre espace de travail. De plus, la classe DecisionTreeRegressor a été importée depuis sklearn.tree.

Cet exercice fait partie du cours

Machine learning avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Importez train_test_split à partir de sklearn.model_selection.
  • Veuillez répartir les données en deux parties : 70 % pour l'entraînement et 30 % pour le test.
  • Instanciez DecisionTreeRegressor avec une profondeur maximale de 4 et min_samples_leaf fixé à 0,26.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Modifier et exécuter le code