Visualisierung der Bedeutung von Merkmalen
In dieser Übung sollst du herausfinden, welche Merkmale die beste Vorhersagekraft für den Random-Forests-Regressor rf haben, den du in einer früheren Übung trainiert hast.
Zu diesem Zweck zeichnest du ein horizontales Balkendiagramm der Merkmalsbedeutung, wie sie von rf bewertet wird. Glücklicherweise ist dies dank der Plot-Funktionen von pandas leicht möglich.
Wir haben ein pandas.Series Objekt mit dem Namen importances erstellt, das die Feature-Namen als index und ihre Bedeutung als Werte enthält. Außerdem ist matplotlib.pyplot als plt und pandas als pd verfügbar.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit baumbasierten Modellen in Python
Anleitung zur Übung
Rufe die Methode
.sort_values()aufimportancesauf und weise das Ergebnisimportances_sortedzu.Rufe die Methode
.plot()aufimportances_sortedauf und setze die Argumente:kindzu'barh'colorzu'lightgreen'
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()