LoslegenKostenlos loslegen

Diagramme mit Merkmalswichtigkeiten für eine Zulassungsanalyse

Als Mitglied des Data-Science-Teams einer Hochschule sollst du bewerten, welche Faktoren die Zulassungsentscheidungen wirklich beeinflussen und welche weniger wichtig sind. Der Zulassungsausschuss weiß zwar, dass der Notendurchschnitt (CGPA) eine wichtige Rolle spielt, möchte dies aber bestätigt haben und andere wichtige Faktoren aufdecken, die das Ergebnis beeinflussen können. Mit einem RandomForestRegressor-Modell (model) kannst du die Wichtigkeit von Merkmalen visualisieren und klar erkennen, welche Aspekte der Bewerberprofile den stärksten und den geringsten Einfluss auf den Entscheidungsprozess haben.

Die Bibliothek shap und die Trainingsdaten (X_train, y_train) wurden bereits geladen.

Diese Übung ist Teil des Kurses

Erklärbare KI in Python

Kurs anzeigen

Anleitung zur Übung

  • Nutze einen TreeExplainer, um shap_values abzuleiten.
  • Verwende die abgeleiteten Werte, shap_values, um die Merkmalswichtigkeiten in einem Balkendiagramm darzustellen und zu analysieren.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Derive shap values
explainer = ____
shap_values = ____

# Plot the feature importance plot
____
Code bearbeiten und ausführen