Créer des fonctions de grid search
En data science, il est très utile d’essayer de construire des algorithmes, des modèles et des processus « from scratch » afin de vraiment comprendre ce qui se passe en profondeur. Bien sûr, il existe d’excellents packages et bibliothèques pour ce travail (et nous y viendrons très bientôt !), mais construire soi‑même vous donnera un vrai avantage dans vos projets de data science.
Dans cet exercice, vous allez créer une fonction qui prend 2 hyperparamètres, entraîne des modèles et renvoie les résultats. Vous utiliserez cette fonction dans un exercice ultérieur.
Les jeux de données X_train, X_test, y_train et y_test sont à votre disposition.
Cet exercice fait partie du cours
Optimisation des hyperparamètres en Python
Instructions
- Créez une fonction qui prend deux paramètres appelés
learning_rateetmax_depthpour le taux d’apprentissage et la profondeur maximale. - Ajoutez dans la fonction la capacité de construire un modèle GBM et de l’ajuster aux données avec les hyperparamètres passés en entrée.
- Faites en sorte que la fonction renvoie les résultats de ce modèle ainsi que les hyperparamètres choisis (
learning_rateetmax_depth).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the function
def gbm_grid_search(____, ____):
# Create the model
model = GradientBoostingClassifier(____=___, ____=____)
# Use the model to make predictions
predictions = model.fit(____, ____).predict(____)
# Return the hyperparameters and score
return([____, ____, accuracy_score(____, ____)])