Instancier le modèle
Dans la série d'exercices suivante, vous diagnostiquerez les problèmes de biais et de variance d'un arbre de régression. L'arbre de régression que vous allez définir dans cet exercice sera utilisé pour prédire la consommation en miles par gallon (mpg) des voitures à partir de l'ensemble de données auto en utilisant toutes les caractéristiques disponibles.
Nous avons déjà traité les données et chargé la matrice des caractéristiques X et le tableau y dans votre espace de travail. De plus, la classe DecisionTreeRegressor a été importée depuis sklearn.tree.
Cet exercice fait partie du cours
Machine learning avec des modèles arborescents en Python
Instructions
- Importez
train_test_splità partir desklearn.model_selection. - Veuillez répartir les données en deux parties : 70 % pour l'entraînement et 30 % pour le test.
- Instanciez
DecisionTreeRegressoravec une profondeur maximale de 4 etmin_samples_leaffixé à 0,26.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import train_test_split from sklearn.model_selection
____
# Set SEED for reproducibility
SEED = 1
# Split the data into 70% train and 30% test
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=SEED)
# Instantiate a DecisionTreeRegressor dt
dt = ____(____=____, ____=____, random_state=SEED)