LoslegenKostenlos loslegen

Visualisierung der Feature-Importanzen

In dieser Übung findest du heraus, welche Features laut dem Random-Forest-Regressor rf, den du in einer vorherigen Übung trainiert hast, am aussagekräftigsten waren.

Dazu zeichnest du ein horizontales Balkendiagramm der von rf ermittelten Feature-Importanz. Zum Glück geht das dank der Plot-Funktionen von pandas ganz einfach.

Wir haben ein pandas.Series-Objekt namens importances erstellt, das die Feature-Namen als index und deren Importanzen als Werte enthält. Zusätzlich ist matplotlib.pyplot als plt und pandas als pd verfügbar.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit baumbasierten Modellen in Python

Kurs anzeigen

Anleitung zur Übung

  • Rufe die Methode .sort_values() auf importances auf und weise das Ergebnis importances_sorted zu.

  • Rufe die Methode .plot() auf importances_sorted auf und setze die Argumente:

    • kind auf 'barh'
    • color auf 'lightgreen'

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Code bearbeiten und ausführen