Recherche de la forêt optimale
Dans cet exercice, vous effectuerez une recherche par grille à l'aide d'une validation croisée à 3 blocs afin de déterminer les hyperparamètres optimaux de rf. Pour évaluer chaque modèle de la grille, vous utiliserez la métrique de l'erreur quadratique moyenne négative.
Notez que la recherche par grille étant un processus de recherche exhaustif, l'entraînement du modèle peut prendre beaucoup de temps. Ici, vous ne ferez qu'instancier l'objet GridSearchCV sans l'ajuster à l'ensemble d'apprentissage. Comme indiqué dans la vidéo, vous pouvez entraîner un tel objet de manière similaire à n'importe quel estimateur scikit-learn en utilisant la méthode .fit() :
grid_object.fit(X_train, y_train)
Le modèle de régression des forêts aléatoires non ajustées rf ainsi que le dictionnaire params_rf que vous avez défini dans l'exercice précédent sont disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Machine learning avec des modèles arborescents en Python
Instructions
Importez
GridSearchCVà partir desklearn.model_selection.Instanciez un objet
GridSearchCVen utilisant une validation croisée à 3 blocs et en utilisant l'erreur quadratique moyenne négative comme métrique de notation.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import GridSearchCV
____
# Instantiate grid_rf
grid_rf = ____(estimator=____,
param_grid=____,
scoring=____,
cv=____,
verbose=1,
n_jobs=-1)