Diagramme mit Merkmalswichtigkeiten für eine Zulassungsanalyse
Als Mitglied des Data-Science-Teams einer Hochschule sollst du bewerten, welche Faktoren die Zulassungsentscheidungen wirklich beeinflussen und welche weniger wichtig sind. Der Zulassungsausschuss weiß zwar, dass der Notendurchschnitt (CGPA) eine wichtige Rolle spielt, möchte dies aber bestätigt haben und andere wichtige Faktoren aufdecken, die das Ergebnis beeinflussen können. Mit einem RandomForestRegressor-Modell (model
) kannst du die Wichtigkeit von Merkmalen visualisieren und klar erkennen, welche Aspekte der Bewerberprofile den stärksten und den geringsten Einfluss auf den Entscheidungsprozess haben.
Die Bibliothek shap
und die Trainingsdaten (X_train
, y_train
) wurden bereits geladen.
Diese Übung ist Teil des Kurses
Erklärbare KI in Python
Anleitung zur Übung
- Nutze einen
TreeExplainer
, umshap_values
abzuleiten. - Verwende die abgeleiteten Werte,
shap_values
, um die Merkmalswichtigkeiten in einem Balkendiagramm darzustellen und zu analysieren.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
# Derive shap values
explainer = ____
shap_values = ____
# Plot the feature importance plot
____