CommencerCommencer gratuitement

Graphiques d’importance des variables pour l’analyse des admissions

Au sein de l’équipe data science d’une université, votre mission est d’évaluer quels facteurs influencent réellement les décisions d’admission et lesquels sont moins déterminants. Le comité d’admission sait que le CGPA joue un rôle clé, mais souhaite le confirmer et mettre en évidence d’autres facteurs importants susceptibles d’influencer les résultats. À l’aide d’un model RandomForestRegressor, vous allez visualiser l’importance des variables afin d’identifier clairement quels aspects des dossiers des candidats comptent le plus et lesquels ont un impact moindre sur le processus de décision.

La bibliothèque shap et les données d’entraînement (X_train, y_train) ont été préchargées pour vous.

Cet exercice fait partie du cours

IA explicable en Python

Afficher le cours

Instructions

  • Calculez les shap_values en utilisant un TreeExplainer.
  • À partir des shap_values obtenues, tracez un graphique en barres de l’importance des variables et analysez-le.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)

# Derive shap values
explainer = ____
shap_values = ____

# Plot the feature importance plot
____
Modifier et exécuter le code