Instancier le modèle
Dans les exercices suivants, vous allez diagnostiquer les problèmes de biais et de variance d'un arbre de régression. L'arbre de régression que vous définirez dans cet exercice sera utilisé pour prédire la consommation en miles par heure des voitures de l'ensemble de données automobiles en utilisant toutes les caractéristiques disponibles.
Nous avons déjà traité les données et chargé la matrice de caractéristiques X
et le tableau y
dans votre espace de travail. En outre, la classe DecisionTreeRegressor
a été importée de sklearn.tree
.
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Instructions
- Importez
train_test_split
à partir desklearn.model_selection
. - Divisez les données en 70 % pour la formation et 30 % pour le test.
- Instanciez un site
DecisionTreeRegressor
avec une profondeur maximale de 4 et une valeur de 0,26 pourmin_samples_leaf
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)