Feature-importanceplots voor toelatingsanalyse
Als lid van het data science-team van een universiteit is het jouw taak om te beoordelen welke factoren toelatingsbeslissingen echt sturen en welke minder belangrijk zijn. De toelatingscommissie weet dat CGPA een sleutelrol speelt, maar wil dit bevestigen en eventuele andere belangrijke factoren ontdekken die de uitkomst kunnen beïnvloeden. Met een RandomForestRegressor-model visualiseer je feature-importance om duidelijk te zien welke onderdelen van het profiel van aanvragers het meest tellen en welke minder impact hebben op het beslisproces.
De bibliotheek shap en de trainingsdata (X_train, y_train) zijn alvast voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Explainable AI in Python
Oefeninstructies
- Bereken de
shap_valuesmet eenTreeExplainer. - Gebruik de berekende
shap_valuesom de feature-importances te plotten met een staafdiagram en analyseer deze.
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
# Derive shap values
explainer = ____
shap_values = ____
# Plot the feature importance plot
____