Diagramme mit Merkmalswichtigkeiten für eine Zulassungsanalyse
Als Mitglied des Data-Science-Teams einer Hochschule sollst du bewerten, welche Faktoren die Zulassungsentscheidungen wirklich beeinflussen und welche weniger wichtig sind. Der Zulassungsausschuss weiß zwar, dass der Notendurchschnitt (CGPA) eine wichtige Rolle spielt, möchte dies aber bestätigt haben und andere wichtige Faktoren aufdecken, die das Ergebnis beeinflussen können. Mit einem RandomForestRegressor-Modell (model) kannst du die Wichtigkeit von Merkmalen visualisieren und klar erkennen, welche Aspekte der Bewerberprofile den stärksten und den geringsten Einfluss auf den Entscheidungsprozess haben.
Die Bibliothek shap und die Trainingsdaten (X_train, y_train) wurden bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Erklärbare KI in Python</Kurs>Übungsanweisungen
- Nutze einen
TreeExplainer, umshap_valuesabzuleiten. - Verwende die abgeleiteten Werte,
shap_values, um die Merkmalswichtigkeiten in einem Balkendiagramm darzustellen und zu analysieren.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
# Derive shap values
explainer = ____
shap_values = ____
# Plot the feature importance plot
____