Feature-importanceplots voor toelatingsanalyse
Als lid van het data science-team van een universiteit is het jouw taak om te beoordelen welke factoren toelatingsbeslissingen echt sturen en welke minder belangrijk zijn. De toelatingscommissie weet dat CGPA een sleutelrol speelt, maar wil dit bevestigen en eventuele andere belangrijke factoren ontdekken die de uitkomst kunnen beïnvloeden. Met een RandomForestRegressor-model visualiseer je feature-importance om duidelijk te zien welke onderdelen van het profiel van aanvragers het meest tellen en welke minder impact hebben op het beslisproces.
De bibliotheek shap en de trainingsdata (X_train, y_train) zijn alvast voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Explainable AI in Python
Oefeninstructies
- Bereken de
shap_valuesmet eenTreeExplainer. - Gebruik de berekende
shap_valuesom de feature-importances te plotten met een staafdiagram en analyseer deze.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
# Derive shap values
explainer = ____
shap_values = ____
# Plot the feature importance plot
____