Recherche de l'arbre optimal
Dans cet exercice, vous effectuerez une recherche par grille en utilisant la validation croisée 5 fois pour trouver les hyperparamètres optimaux de dt
. Notez que la recherche sur la grille étant un processus exhaustif, l'entraînement du modèle peut prendre beaucoup de temps. Ici, vous ne ferez qu'instancier l'objet GridSearchCV
sans l'adapter à l'ensemble d'apprentissage. Comme indiqué dans la vidéo, vous pouvez former un tel objet de la même manière que n'importe quel estimateur scikit-learn en utilisant la méthode .fit()
:
grid_object.fit(X_train, y_train)
Un arbre de classification non accordé dt
ainsi que le dictionnaire params_dt
que vous avez défini dans l'exercice précédent sont disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Instructions
Importez
GridSearchCV
à partir desklearn.model_selection
.Instanciez un objet
GridSearchCV
en utilisant 5 fois CV en définissant les paramètres :estimator
àdt
,param_grid
àparams_dt
etscoring
à l'adresse'roc_auc'
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import GridSearchCV
____
# Instantiate grid_dt
grid_dt = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
n_jobs=-1)