Visualisierung der Feature-Importanzen
In dieser Übung findest du heraus, welche Features laut dem Random-Forest-Regressor rf, den du in einer vorherigen Übung trainiert hast, am aussagekräftigsten waren.
Dazu zeichnest du ein horizontales Balkendiagramm der von rf ermittelten Feature-Importanz. Zum Glück geht das dank der Plot-Funktionen von pandas ganz einfach.
Wir haben ein pandas.Series-Objekt namens importances erstellt, das die Feature-Namen als index und deren Importanzen als Werte enthält. Zusätzlich ist matplotlib.pyplot als plt und pandas als pd verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Rufe die Methode
.sort_values()aufimportancesauf und weise das Ergebnisimportances_sortedzu.Rufe die Methode
.plot()aufimportances_sortedauf und setze die Argumente:kindauf'barh'colorauf'lightgreen'
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()