Graphiques d’importance des variables pour l’analyse des admissions
Au sein de l’équipe data science d’une université, votre mission est d’évaluer quels facteurs influencent réellement les décisions d’admission et lesquels sont moins déterminants. Le comité d’admission sait que le CGPA joue un rôle clé, mais souhaite le confirmer et mettre en évidence d’autres facteurs importants susceptibles d’influencer les résultats. À l’aide d’un model RandomForestRegressor, vous allez visualiser l’importance des variables afin d’identifier clairement quels aspects des dossiers des candidats comptent le plus et lesquels ont un impact moindre sur le processus de décision.
La bibliothèque shap et les données d’entraînement (X_train, y_train) ont été préchargées pour vous.
Cet exercice fait partie du cours
IA explicable en Python
Instructions
- Calculez les
shap_valuesen utilisant unTreeExplainer. - À partir des
shap_valuesobtenues, tracez un graphique en barres de l’importance des variables et analysez-le.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
model = RandomForestRegressor(random_state=42)
model.fit(X_train, y_train)
# Derive shap values
explainer = ____
shap_values = ____
# Plot the feature importance plot
____