Aan de slagGa gratis aan de slag

Feature-importanceplots voor toelatingsanalyse

Als lid van het data science-team van een universiteit is het jouw taak om te beoordelen welke factoren toelatingsbeslissingen echt sturen en welke minder belangrijk zijn. De toelatingscommissie weet dat CGPA een sleutelrol speelt, maar wil dit bevestigen en eventuele andere belangrijke factoren ontdekken die de uitkomst kunnen beïnvloeden. Met een RandomForestRegressor-model visualiseer je feature-importance om duidelijk te zien welke onderdelen van het profiel van aanvragers het meest tellen en welke minder impact hebben op het beslisproces.

De bibliotheek shap en de trainingsdata (X_train, y_train) zijn alvast voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

Cursus bekijken

Oefeninstructies

  • Bereken de shap_values met een TreeExplainer.
  • Gebruik de berekende shap_values om de feature-importances te plotten met een staafdiagram en analyseer deze.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Derive shap values
explainer = ____
shap_values = ____

# Plot the feature importance plot
____
Code bewerken en uitvoeren