CommencerCommencer gratuitement

Ajuster le nombre de features

Les hyperparamètres par défaut utilisés par vos modèles ne sont pas optimisés pour vos données. L’objectif de la validation croisée par recherche sur grille (grid search) est d’identifier les hyperparamètres qui conduisent aux meilleures performances du modèle. Dans la vidéo, vous avez vu comment l’hyperparamètre n_estimators de la forêt aléatoire a été ajusté. Ici, vous allez vous entraîner à ajuster l’hyperparamètre max_features. L’hyperparamètre cv est fixé à 3 afin que le code s’exécute rapidement.

Hyperparameter Purpose
max_features Number of features for best split

Une forêt aléatoire est un ensemble de nombreux arbres de décision. L’hyperparamètre n_estimators contrôle le nombre d’arbres à utiliser dans la forêt, tandis que l’hyperparamètre max_features contrôle le nombre de features que la forêt aléatoire doit considérer lorsqu’elle recherche la meilleure coupure dans un arbre de décision.

Un classifieur de forêt aléatoire a été instancié pour vous sous le nom clf.

Cet exercice fait partie du cours

Marketing Analytics : prédire l’attrition client en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import GridSearchCV
Modifier et exécuter le code