Recherche en grille avec validation croisée pour la complexité du modèle
Dans la dernière diapositive, vous avez vu que la plupart des classificateurs ont un ou plusieurs hyperparamètres qui contrôlent leur complexité. Vous avez aussi appris à les ajuster avec GridSearchCV(). Dans cet exercice, vous allez perfectionner cette compétence. Vous allez expérimenter :
- Le nombre d’arbres,
n_estimators, dans unRandomForestClassifier. - La profondeur maximale,
max_depth, des arbres de décision utilisés dans unAdaBoostClassifier. - Le nombre de plus proches voisins,
n_neighbors, dansKNeighborsClassifier.
Cet exercice fait partie du cours
Concevoir des workflows de Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set a range for n_estimators from 10 to 40 in steps of 10
param_grid = {'____': range(10, ____, ____)}
# Optimize for a RandomForestClassifier() using GridSearchCV
grid = GridSearchCV(____, param_grid, cv=3)
grid.fit(X, y)
grid.best_params_