Importances des variables
Même si certains attributs des bonbons, comme le chocolat, sont très appréciés, cela ne signifie pas qu’ils seront importants pour la prédiction du modèle. Une fois un modèle de random forest ajusté, vous pouvez consulter l’attribut du modèle, .feature_importances_, pour voir quelles variables ont eu le plus d’impact. Vous pouvez vérifier l’importance de chaque variable dans le modèle en parcourant le tableau des importances avec enumerate().
Si vous ne connaissez pas la fonction enumerate() de Python, elle permet d’itérer sur une liste tout en créant automatiquement un compteur.
Cet exercice fait partie du cours
Validation des modèles en Python
Instructions
- Parcourez la sortie des importances de
rfr. - Affichez les noms de colonnes de
X_trainainsi que le score d’importance correspondant à chaque colonne.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit the model using X and y
rfr.fit(X_train, y_train)
# Print how important each column is to the model
for i, item in enumerate(rfr.____):
# Use i and item to print out the feature importance of each column
print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))