CommencerCommencer gratuitement

Visualisation de l'importance des caractéristiques

Dans cet exercice, vous déterminerez quelles caractéristiques étaient les plus prédictives selon le régresseur Random Forests rf que vous avez formé dans un exercice précédent.

À cette fin, vous allez créer un histogramme horizontal représentant l'importance des caractéristiques telle qu'évaluée par rf. Heureusement, cela peut être réalisé facilement grâce aux capacités graphiques d'pandas.

Nous avons créé un objet pandas.Series appelé importances contenant les noms des fonctionnalités en tant qu'index s et leur importance en tant que valeurs. De plus, matplotlib.pyplot est disponible à l'adresse plt et pandas à l'adresse pd.

Cet exercice fait partie du cours

Machine learning avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Veuillez appeler la méthode « .sort_values() » sur « importances » et attribuer le résultat à « importances_sorted ».

  • Veuillez appeler la méthode ` .plot() sur importances_sorted ` et définir les arguments :

    • kind à 'barh'

    • color à 'lightgreen'

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Modifier et exécuter le code