CommencerCommencer gratuitement

Visualisation de l'importance des caractéristiques

Dans cet exercice, vous déterminerez les caractéristiques les plus prédictives selon le régresseur des forêts aléatoires rf que vous avez formé dans un exercice précédent.

Pour ce faire, vous tracerez un diagramme à barres horizontal de l'importance de la caractéristique telle qu'elle est évaluée par rf. Heureusement, cela peut être fait facilement grâce aux capacités de traçage de pandas.

Nous avons créé un objet pandas.Series appelé importances contenant les noms des caractéristiques comme index et leurs importances comme valeurs. En outre, matplotlib.pyplot est disponible en tant que plt et pandas en tant que pd.

Cet exercice fait partie du cours

Apprentissage automatique avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Appelez la méthode .sort_values() sur importances et affectez le résultat à importances_sorted.

  • Appelez la méthode .plot() sur importances_sorted et définissez les arguments :

    • kind à 'barh'

    • color à 'lightgreen'

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Modifier et exécuter le code