Identifier les principaux prédicteurs des frais médicaux avec SHAP
Les valeurs SHAP offrent des explications pertinentes sur les prédictions réalisées par les modèles de Machine Learning. Vous allez maintenant utiliser SHAP pour comprendre l’influence de différentes variables d’un model RandomForestRegressor sur la prédiction des frais d’assurance.
X (variables prédictives) et y (frais d’assurance), ainsi que le model RandomForest regressor, ont été préchargés pour vous.
Veuillez noter que l’exécution du code peut prendre un certain temps.
Cet exercice fait partie du cours
IA explicable en Python
Instructions
- Initialisez un explainer SHAP pour arbres nommé
explainerpour lemodelRandomForest. - Calculez les
shap_valuespour le jeu de données. - Calculez la moyenne absolue des valeurs SHAP pour identifier les variables les plus influentes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import shap
# Create a SHAP Tree Explainer
explainer = ____
# Calculate SHAP values
shap_values = ____
# Calculate mean absolute SHAP values
mean_abs_shap = ____
plt.bar(X.columns, mean_abs_shap)
plt.title('Mean Absolute SHAP Values for RandomForest')
plt.xticks(rotation=45)
plt.show()