CommencerCommencez gratuitement

Identifier les principaux prédicteurs des frais médicaux avec SHAP

Les valeurs SHAP offrent des explications pertinentes sur les prédictions réalisées par les modèles de Machine Learning. Vous allez maintenant utiliser SHAP pour comprendre l’influence de différentes variables d’un model RandomForestRegressor sur la prédiction des frais d’assurance.

X (variables prédictives) et y (frais d’assurance), ainsi que le model RandomForest regressor, ont été préchargés pour vous.

Veuillez noter que l’exécution du code peut prendre un certain temps.

Cet exercice fait partie du cours

<cours>IA explicable en Python</cours>
Voir le cours

Instructions de l’exercice

  • Initialisez un explainer SHAP pour arbres nommé explainer pour le model RandomForest.
  • Calculez les shap_values pour le jeu de données.
  • Calculez la moyenne absolue des valeurs SHAP pour identifier les variables les plus influentes.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

import shap

# Create a SHAP Tree Explainer
explainer = ____

# Calculate SHAP values
shap_values = ____

# Calculate mean absolute SHAP values
mean_abs_shap = ____

plt.bar(X.columns, mean_abs_shap)
plt.title('Mean Absolute SHAP Values for RandomForest')
plt.xticks(rotation=45)
plt.show()
Modifier et exécuter le code