CommencerCommencer gratuitement

Identifier les principaux prédicteurs des frais médicaux avec SHAP

Les valeurs SHAP offrent des explications pertinentes sur les prédictions réalisées par les modèles de Machine Learning. Vous allez maintenant utiliser SHAP pour comprendre l’influence de différentes variables d’un model RandomForestRegressor sur la prédiction des frais d’assurance.

X (variables prédictives) et y (frais d’assurance), ainsi que le model RandomForest regressor, ont été préchargés pour vous.

Veuillez noter que l’exécution du code peut prendre un certain temps.

Cet exercice fait partie du cours

IA explicable en Python

Afficher le cours

Instructions

  • Initialisez un explainer SHAP pour arbres nommé explainer pour le model RandomForest.
  • Calculez les shap_values pour le jeu de données.
  • Calculez la moyenne absolue des valeurs SHAP pour identifier les variables les plus influentes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import shap

# Create a SHAP Tree Explainer
explainer = ____

# Calculate SHAP values
shap_values = ____

# Calculate mean absolute SHAP values
mean_abs_shap = ____

plt.bar(X.columns, mean_abs_shap)
plt.title('Mean Absolute SHAP Values for RandomForest')
plt.xticks(rotation=45)
plt.show()
Modifier et exécuter le code