Belangrijkste voorspellers van medische kosten vinden met SHAP
SHAP-waarden geven verhelderende uitleg bij voorspellingen van Machine Learning-modellen. Je gaat SHAP gebruiken om te achterhalen hoe verschillende features in een RandomForestRegressor-model bijdragen aan het voorspellen van verzekeringskosten.
X met de predictor-features en y met de verzekeringskosten, samen met het RandomForest-regressor-model, zijn al voor je geladen.
Let op: het kan even duren voordat de code klaar is met draaien.
Deze oefening maakt deel uit van de cursus
Explainable AI in Python
Oefeninstructies
- Initialiseer een SHAP tree-explainer met de naam
explainervoor het RandomForest-model. - Bereken
shap_valuesvoor de gegevensset. - Bereken de gemiddelde absolute SHAP-waarden om de meest invloedrijke features te vinden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import shap
# Create a SHAP Tree Explainer
explainer = ____
# Calculate SHAP values
shap_values = ____
# Calculate mean absolute SHAP values
mean_abs_shap = ____
plt.bar(X.columns, mean_abs_shap)
plt.title('Mean Absolute SHAP Values for RandomForest')
plt.xticks(rotation=45)
plt.show()