CommencerCommencer gratuitement

Recherche de l'arbre optimal

Dans cet exercice, vous effectuerez une recherche par quadrillage à l'aide d'une validation croisée à 5 blocs afin de déterminer les hyperparamètres optimaux de dt. Notez que la recherche par grille étant un processus exhaustif, l'entraînement du modèle peut prendre beaucoup de temps. Ici, vous ne ferez qu'instancier l'objet GridSearchCV sans l'ajuster à l'ensemble d'apprentissage. Comme indiqué dans la vidéo, vous pouvez entraîner un tel objet de manière similaire à n'importe quel estimateur scikit-learn en utilisant la méthode .fit() :

grid_object.fit(X_train, y_train)

Un arbre de classification non ajusté dt ainsi que le dictionnaire params_dt que vous avez défini dans l'exercice précédent sont disponibles dans votre espace de travail.

Cet exercice fait partie du cours

Machine learning avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Importez GridSearchCV à partir de sklearn.model_selection.

  • Instanciez un objet GridSearchCV en utilisant une validation croisée à 5 blocs en définissant les paramètres suivants :

    • estimator à dt, param_grid à params_dt et

    • scoring à 'roc_auc'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import GridSearchCV
____

# Instantiate grid_dt
grid_dt = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       n_jobs=-1)
Modifier et exécuter le code