Berechnung der Merkmalswichtigkeit bei Random Forests
Als Data Scientist bei einem Finanzberatungsunternehmen hast du einen Random-Forest-Klassifikator entwickelt, der Personen nach ihrer Einkommenshöhe klassifiziert. Jetzt musst du das Modell erklären, indem du die Merkmalswichtigkeit analysierst, um die Schlüsselfaktoren zu bestimmen, anhand derer das Einkommen vorhergesagt wird. So wird eine gezieltere Marktsegmentierung und bessere strategische Entscheidungsfindung ermöglicht.
matplotlib.pyplot
wurde als plt
importiert. X_train
und y_train
sind bereits geladen.
Diese Übung ist Teil des Kurses
Erklärbare KI in Python
Anleitung zur Übung
- Extrahiere die Merkmalswichtigkeiten aus dem Modell.
- Erstelle ein Diagramm der Merkmalsgewichtungen (
feature_importances
).
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)
# Derive feature importances
feature_importances = ____
# Plot the feature importances
____
plt.show()