1. Apprendre
  2. /
  3. Cours
  4. /
  5. Machine Learning avec des modèles à base d'arbres en Python

Connected

Exercice

Rechercher l'arbre optimal

Dans cet exercice, vous allez effectuer une recherche par grille avec une validation croisée à 5 plis pour trouver les hyperparamètres optimaux de dt. Notez que, comme la recherche par grille est un processus exhaustif, l'entraînement du modèle peut prendre beaucoup de temps. Ici, vous allez seulement instancier l'objet GridSearchCV sans l'ajuster à l'ensemble d'entraînement. Comme expliqué dans la vidéo, vous pouvez entraîner un tel objet comme n'importe quel estimateur scikit-learn en utilisant la méthode .fit() :

grid_object.fit(X_train, y_train)

Un arbre de classification non optimisé dt, ainsi que le dictionnaire params_dt que vous avez défini dans l'exercice précédent, sont disponibles dans votre espace de travail.

Instructions

100 XP
  • Importez GridSearchCV depuis sklearn.model_selection.

  • Instanciez un objet GridSearchCV en utilisant une CV à 5 plis en définissant les paramètres :

    • estimator à dt, param_grid à params_dt et

    • scoring à 'roc_auc'.