GridSearchCV avec Scikit Learn
Le module GridSearchCV de Scikit Learn propose de nombreuses fonctionnalités utiles pour réaliser efficacement une grid search. Vous allez maintenant mettre cela en pratique en créant un objet GridSearchCV avec certains paramètres.
Les options souhaitées sont :
- Un estimateur Random Forest, avec le critère de séparation « entropy »
- Une validation croisée en 5 plis (5-fold)
- Les hyperparamètres
max_depth(2, 4, 8, 15) etmax_features(« auto » vs « sqrt ») - Utiliser
roc_aucpour évaluer les modèles - Utiliser 4 cœurs pour un traitement en parallèle
- Veiller à réentraîner (refit) le meilleur modèle et renvoyer les scores d’entraînement
Vous disposez des jeux de données X_train, X_test, y_train et y_test.
Cet exercice fait partie du cours
Optimisation des hyperparamètres en Python
Instructions
- Créez un estimateur Random Forest comme indiqué dans le contexte ci-dessus.
- Créez une grille de paramètres comme indiqué dans le contexte ci-dessus.
- Créez un objet
GridSearchCVcomme décrit dans le contexte ci-dessus, en utilisant les deux éléments créés dans les deux instructions précédentes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a Random Forest Classifier with specified criterion
rf_class = RandomForestClassifier(____=____)
# Create the parameter grid
param_grid = {____: ____, ____: ____}
# Create a GridSearchCV object
grid_rf_class = GridSearchCV(
estimator=____,
param_grid=____,
scoring=____,
n_jobs=____,
cv=____,
refit=____, return_train_score=____)
print(grid_rf_class)