Berechnung der Merkmalswichtigkeit bei Random Forests
Als Data Scientist bei einem Finanzberatungsunternehmen hast du einen Random-Forest-Klassifikator entwickelt, der Personen nach ihrer Einkommenshöhe klassifiziert. Jetzt musst du das Modell erklären, indem du die Merkmalswichtigkeit analysierst, um die Schlüsselfaktoren zu bestimmen, anhand derer das Einkommen vorhergesagt wird. So wird eine gezieltere Marktsegmentierung und bessere strategische Entscheidungsfindung ermöglicht.
matplotlib.pyplot wurde als plt importiert. X_train und y_train sind bereits geladen.
Diese Übung ist Teil des Kurses
Erklärbare KI in Python
Anleitung zur Übung
- Extrahiere die Merkmalswichtigkeiten aus dem Modell.
- Erstelle ein Diagramm der Merkmalsgewichtungen (
feature_importances).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)
# Derive feature importances
feature_importances = ____
# Plot the feature importances
____
plt.show()