Se préparer à RandomizedSearch
Le semestre dernier, votre professeur a mis votre classe au défi de construire un modèle prédictif pour estimer les notes finales à l’examen. Vous avez essayé plusieurs modèles en sélectionnant aléatoirement des hyperparamètres. Cependant, l’exécution de chaque modèle vous obligeait à le coder individuellement.
Après avoir découvert RandomizedSearchCV(), vous reprenez le défi de votre professeur pour construire le meilleur modèle. Dans cet exercice, vous allez préparer les trois entrées nécessaires pour effectuer une recherche aléatoire.
Cet exercice fait partie du cours
Validation des modèles en Python
Instructions
- Finalisez le dictionnaire de paramètres en ajoutant une liste pour le paramètre
max_depthavec les options 2, 4, 6 et 8. - Créez un modèle de régression par forêt aléatoire avec dix arbres et un
random_statede 1111. - Créez un scoreur d’erreur quadratique moyenne à utiliser.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import make_scorer, mean_squared_error
# Finish the dictionary by adding the max_depth parameter
param_dist = {"____": [____],
"max_features": [2, 4, 6, 8, 10],
"min_samples_split": [2, 4, 8, 16]}
# Create a random forest regression model
rfr = ____(____=10, ____=1111)
# Create a scorer to use (use the mean squared error)
scorer = ____(____)