CommencerCommencer gratuitement

GridSearchCV avec Scikit Learn

Le module GridSearchCV de Scikit Learn propose de nombreuses fonctionnalités utiles pour réaliser efficacement une grid search. Vous allez maintenant mettre cela en pratique en créant un objet GridSearchCV avec certains paramètres.

Les options souhaitées sont :

  • Un estimateur Random Forest, avec le critère de séparation « entropy »
  • Une validation croisée en 5 plis (5-fold)
  • Les hyperparamètres max_depth (2, 4, 8, 15) et max_features (« auto » vs « sqrt »)
  • Utiliser roc_auc pour évaluer les modèles
  • Utiliser 4 cœurs pour un traitement en parallèle
  • Veiller à réentraîner (refit) le meilleur modèle et renvoyer les scores d’entraînement

Vous disposez des jeux de données X_train, X_test, y_train et y_test.

Cet exercice fait partie du cours

Optimisation des hyperparamètres en Python

Afficher le cours

Instructions

  • Créez un estimateur Random Forest comme indiqué dans le contexte ci-dessus.
  • Créez une grille de paramètres comme indiqué dans le contexte ci-dessus.
  • Créez un objet GridSearchCV comme décrit dans le contexte ci-dessus, en utilisant les deux éléments créés dans les deux instructions précédentes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)

# Create the parameter grid
param_grid = {____: ____, ____: ____} 

# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
    estimator=____,
    param_grid=____,
    scoring=____,
    n_jobs=____,
    cv=____,
    refit=____, return_train_score=____)
print(grid_rf_class)
Modifier et exécuter le code