Visualisierung der Feature-Importanzen
In dieser Übung findest du heraus, welche Features laut dem Random-Forest-Regressor rf, den du in einer vorherigen Übung trainiert hast, am aussagekräftigsten waren.
Dazu zeichnest du ein horizontales Balkendiagramm der von rf ermittelten Feature-Importanz. Zum Glück geht das dank der Plot-Funktionen von pandas ganz einfach.
Wir haben ein pandas.Series-Objekt namens importances erstellt, das die Feature-Namen als index und deren Importanzen als Werte enthält. Zusätzlich ist matplotlib.pyplot als plt und pandas als pd verfügbar.
Diese Übung ist Teil des Kurses
<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>Übungsanweisungen
Rufe die Methode
.sort_values()aufimportancesauf und weise das Ergebnisimportances_sortedzu.Rufe die Methode
.plot()aufimportances_sortedauf und setze die Argumente:kindauf'barh'colorauf'lightgreen'
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()