LoslegenKostenlos starten

Visualisierung der Feature-Importanzen

In dieser Übung findest du heraus, welche Features laut dem Random-Forest-Regressor rf, den du in einer vorherigen Übung trainiert hast, am aussagekräftigsten waren.

Dazu zeichnest du ein horizontales Balkendiagramm der von rf ermittelten Feature-Importanz. Zum Glück geht das dank der Plot-Funktionen von pandas ganz einfach.

Wir haben ein pandas.Series-Objekt namens importances erstellt, das die Feature-Namen als index und deren Importanzen als Werte enthält. Zusätzlich ist matplotlib.pyplot als plt und pandas als pd verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen mit baumbasierten Modellen in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Rufe die Methode .sort_values() auf importances auf und weise das Ergebnis importances_sorted zu.

  • Rufe die Methode .plot() auf importances_sorted auf und setze die Argumente:

    • kind auf 'barh'
    • color auf 'lightgreen'

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Code bearbeiten und ausführen