CommencerCommencer gratuitement

Instancier le modèle

Dans les exercices suivants, vous allez diagnostiquer les problèmes de biais et de variance d'un arbre de régression. L'arbre de régression que vous définirez dans cet exercice sera utilisé pour prédire la consommation en miles par heure des voitures de l'ensemble de données automobiles en utilisant toutes les caractéristiques disponibles.

Nous avons déjà traité les données et chargé la matrice de caractéristiques X et le tableau y dans votre espace de travail. En outre, la classe DecisionTreeRegressor a été importée de sklearn.tree.

Cet exercice fait partie du cours

Apprentissage automatique avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Importez train_test_split à partir de sklearn.model_selection.
  • Divisez les données en 70 % pour la formation et 30 % pour le test.
  • Instanciez un site DecisionTreeRegressor avec une profondeur maximale de 4 et une valeur de 0,26 pour min_samples_leaf.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import train_test_split from sklearn.model_selection
____

# Set SEED for reproducibility
SEED = 1

# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)

# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)
Modifier et exécuter le code