CommencerCommencer gratuitement

Importances des variables

Même si certains attributs des bonbons, comme le chocolat, sont très appréciés, cela ne signifie pas qu’ils seront importants pour la prédiction du modèle. Une fois un modèle de random forest ajusté, vous pouvez consulter l’attribut du modèle, .feature_importances_, pour voir quelles variables ont eu le plus d’impact. Vous pouvez vérifier l’importance de chaque variable dans le modèle en parcourant le tableau des importances avec enumerate().

Si vous ne connaissez pas la fonction enumerate() de Python, elle permet d’itérer sur une liste tout en créant automatiquement un compteur.

Cet exercice fait partie du cours

Validation des modèles en Python

Afficher le cours

Instructions

  • Parcourez la sortie des importances de rfr.
  • Affichez les noms de colonnes de X_train ainsi que le score d’importance correspondant à chaque colonne.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit the model using X and y
rfr.fit(X_train, y_train)

# Print how important each column is to the model
for i, item in enumerate(rfr.____):
      # Use i and item to print out the feature importance of each column
    print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))
Modifier et exécuter le code