Feature-Importances
Auch wenn einige Süßigkeiten-Merkmale, wie z. B. Schokolade, extrem beliebt sind, heißt das nicht, dass sie für die Vorhersage im Modell wichtig sind. Nachdem ein Random-Forest-Modell trainiert wurde, kannst du das Modellattribut .feature_importances_ auswerten, um zu sehen, welche Variablen den größten Einfluss hatten. Du kannst prüfen, wie wichtig jede Variable im Modell war, indem du mit enumerate() über das Array der Feature-Importances iterierst.
Falls dir Pythons Funktion enumerate() nicht vertraut ist: Damit kannst du über eine Liste iterieren und gleichzeitig einen automatischen Zähler erzeugen.
Diese Übung ist Teil des Kurses
Modellvalidierung in Python
Anleitung zur Übung
- Iteriere durch die Feature-Importances von
rfr. - Gib die Spaltennamen von
X_trainund den Importance-Score für diese Spalte aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit the model using X and y
rfr.fit(X_train, y_train)
# Print how important each column is to the model
for i, item in enumerate(rfr.____):
# Use i and item to print out the feature importance of each column
print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))