CommencerCommencer gratuitement

Recherche de la forêt optimale

Dans cet exercice, vous effectuerez une recherche par grille en utilisant la validation croisée 3 fois pour trouver les hyperparamètres optimaux de rf. Pour évaluer chaque modèle de la grille, vous utiliserez la métrique de l' erreur quadratique moyenne négative.

Notez que la recherche en grille étant un processus de recherche exhaustif, l'apprentissage du modèle peut prendre beaucoup de temps. Ici, vous ne ferez qu'instancier l'objet GridSearchCV sans l'adapter à l'ensemble d'apprentissage. Comme indiqué dans la vidéo, vous pouvez former un tel objet de la même manière que n'importe quel estimateur scikit-learn en utilisant la méthode .fit():

grid_object.fit(X_train, y_train)

Le modèle de régresseur de forêts aléatoires non ajusté rf ainsi que le dictionnaire params_rf que vous avez défini dans l'exercice précédent sont disponibles dans votre espace de travail.

Cet exercice fait partie du cours

Apprentissage automatique avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Importez GridSearchCV à partir de sklearn.model_selection.

  • Instanciation d'un objet GridSearchCV à l'aide de 3 fois CV en utilisant l'erreur quadratique moyenne négative comme métrique de notation.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import GridSearchCV
____

# Instantiate grid_rf
grid_rf = ____(estimator=____,
                       param_grid=____,
                       scoring=____,
                       cv=____,
                       verbose=1,
                       n_jobs=-1)
Modifier et exécuter le code