Visualisation de l'importance des caractéristiques
Dans cet exercice, vous déterminerez les caractéristiques les plus prédictives selon le régresseur des forêts aléatoires rf
que vous avez formé dans un exercice précédent.
Pour ce faire, vous tracerez un diagramme à barres horizontal de l'importance de la caractéristique telle qu'elle est évaluée par rf
. Heureusement, cela peut être fait facilement grâce aux capacités de traçage de pandas
.
Nous avons créé un objet pandas.Series
appelé importances
contenant les noms des caractéristiques comme index
et leurs importances comme valeurs. En outre, matplotlib.pyplot
est disponible en tant que plt
et pandas
en tant que pd
.
Cet exercice fait partie du cours
Apprentissage automatique avec des modèles arborescents en Python
Instructions
Appelez la méthode
.sort_values()
surimportances
et affectez le résultat àimportances_sorted
.Appelez la méthode
.plot()
surimportances_sorted
et définissez les arguments :kind
à'barh'
color
à'lightgreen'
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()