Visualisation de l'importance des caractéristiques
Dans cet exercice, vous déterminerez quelles caractéristiques étaient les plus prédictives selon le régresseur Random Forests rf que vous avez formé dans un exercice précédent.
À cette fin, vous allez créer un histogramme horizontal représentant l'importance des caractéristiques telle qu'évaluée par rf. Heureusement, cela peut être réalisé facilement grâce aux capacités graphiques d'pandas.
Nous avons créé un objet pandas.Series appelé importances contenant les noms des fonctionnalités en tant qu'index s et leur importance en tant que valeurs. De plus, matplotlib.pyplot est disponible à l'adresse plt et pandas à l'adresse pd.
Cet exercice fait partie du cours
Machine learning avec des modèles arborescents en Python
Instructions
Veuillez appeler la méthode «
.sort_values()» sur «importances» et attribuer le résultat à «importances_sorted».Veuillez appeler la méthode `
.plot()surimportances_sorted` et définir les arguments :kindà'barh'colorà'lightgreen'
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()