Optimisation bayésienne des hyperparamètres avec Hyperopt

Dans cet exemple, vous allez configurer et exécuter un processus d’optimisation bayésienne des hyperparamètres à l’aide du package Hyperopt (déjà importé sous le nom hp). Vous allez définir le domaine (similaire à la définition de la grille pour une recherche sur grille), puis définir la fonction objectif. Enfin, vous exécuterez l’optimiseur sur 20 itérations.

Vous devez configurer le domaine avec les valeurs suivantes :

max_depth à l’aide d’une distribution quniform (entre 2 et 10, par pas de 2)
learning_rate à l’aide d’une distribution uniform (de 0.001 à 0.9)

Notez que, pour les besoins de cet exercice, la taille de l’échantillon de données ainsi que le nombre d’itérations d’hyperopt et du GBM ont été réduits. Si vous testez cette méthode par vous-même sur votre machine, essayez un espace de recherche plus vaste, davantage d’itérations (trials), plus de folds de validation croisée et un jeu de données plus large pour vraiment voir la méthode à l’œuvre !

Cet exercice fait partie du cours

Optimisation des hyperparamètres en Python

Afficher le cours

Instructions

Créez un dictionnaire space en utilisant le domaine indiqué ci-dessus.
Définissez la fonction objectif en utilisant un classifieur de gradient boosting.
Exécutez l’algorithme pour 20 évaluations (utilisez simplement l’algorithme par défaut suggéré dans les diapositives).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set up space dictionary with specified hyperparameters
space = {'max_depth': hp.____('max_depth', ____, ____, ____),'learning_rate': hp.____('learning_rate', ____,____)}

# Set up objective function
def objective(params):
    params = {'max_depth': int(params[____]),'learning_rate': params[____]}
    gbm_clf = ____(n_estimators=100, **params) 
    best_score = cross_val_score(gbm_clf, X_train, y_train, scoring='accuracy', cv=2, n_jobs=4).mean()
    loss = 1 - ____
    return ____

# Run the algorithm
best = fmin(fn=____,space=space, max_evals=____, rstate=np.random.default_rng(42), algo=tpe.suggest)
print(____)

Modifier et exécuter le code

Cet exercice fait partie du cours

Optimisation des hyperparamètres en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Dans ce chapitre d’introduction, vous apprendrez la différence entre hyperparamètres et paramètres. Vous vous exercerez à extraire et analyser des paramètres, puis à définir des valeurs d’hyperparamètres pour plusieurs algorithmes de Machine Learning courants. Au passage, vous verrez des bonnes pratiques pour choisir quels hyperparamètres optimiser, quelles valeurs tester, et vous construirez des courbes d’apprentissage pour analyser vos choix.

Exercise 1: Introduction et « Paramètres »Exercise 2: Paramètres dans la régression logistique Exercise 3: Extraire un paramètre de régression logistique Exercise 4: Extraire un paramètre d’un Random Forest Exercise 5: Introduction aux hyperparamètres Exercise 6: Hyperparamètres dans les Random Forests Exercise 7: Explorer les hyperparamètres de Random Forest Exercise 8: Hyperparamètres de KNN Exercise 9: Définir et analyser les valeurs d’hyperparamètres Exercise 10: Automatiser le choix des hyperparamètres Exercise 11: Construire des courbes d’apprentissage

Ce chapitre vous présente une méthode populaire d’optimisation automatique des hyperparamètres appelée Grid Search. Vous verrez de quoi il s’agit, comment cela fonctionne, et vous pratiquerez une Grid Search avec Scikit Learn. Vous apprendrez ensuite à analyser les résultats d’une Grid Search et vous entraînerez sur des exemples concrets.

Exercise 1: Introduction à la Grid Search Exercise 2: Créer des fonctions de grid search Exercise 3: Ajuster itérativement plusieurs hyperparamètres Exercise 4: Combien de modèles ?Exercise 5: Grid Search avec Scikit Learn Exercise 6: Entrées de GridSearchCV Exercise 7: GridSearchCV avec Scikit Learn Exercise 8: Comprendre la sortie d’une grid search Exercise 9: Utiliser les meilleurs résultats Exercise 10: Explorer les résultats de la grid search Exercise 11: Analyser les meilleurs résultats Exercise 12: Exploiter les meilleurs résultats

Dans ce chapitre, vous découvrirez une autre méthode populaire d’optimisation automatique des hyperparamètres : la Random Search. Vous verrez ce que c’est, comment elle fonctionne et, surtout, en quoi elle diffère de la grid search. Vous étudierez ses avantages et ses limites, et quand la privilégier par rapport à la Grid Search. Vous pratiquerez une Random Search avec Scikit Learn, ainsi que la visualisation et l’interprétation des résultats.

Exercise 1: Introduction à la Random Search Exercise 2: Échantillonner aléatoirement des hyperparamètres Exercise 3: Recherche aléatoire avec Random Forest Exercise 4: Visualiser une Random Search Exercise 5: Random Search avec Scikit Learn Exercise 6: Entrées de RandomSearchCV Exercise 7: L’objet RandomizedSearchCV Exercise 8: RandomizedSearchCV dans Scikit Learn Exercise 9: Comparer Grid Search et Random Search Exercise 10: Comparer Random Search et Grid Search Exercise 11: Grid Search et Random Search côte à côte

Dans ce dernier chapitre, vous aurez un aperçu de méthodes plus avancées d’optimisation des hyperparamètres, regroupées sous le terme « informed search ». Cela inclut une approche dite « coarse to fine », ainsi que des algorithmes bayésiens et génétiques. Vous verrez en quoi l’informed search se distingue de l’uninformed search et acquerrez des compétences pratiques sur chacune des approches mentionnées, en les comparant au fil du chapitre.

Exercise 1: Recherche informée : du global au fin Exercise 2: Visualiser la méthode « du grossier au précis »Exercise 3: Itérations du grossier au fin Exercise 4: Recherche informée : statistiques bayésiennes Exercise 5: Règle de Bayes en Python Exercise 6: Optimisation bayésienne des hyperparamètres avec Hyperopt

Exercice en cours

Exercise 7: Recherche informée : algorithmes génétiques Exercise 8: Réglage génétique des hyperparamètres avec TPOT Exercise 9: Analyser la stabilité de TPOT Exercise 10: Félicitations !