Calcul de l’importance des variables avec les random forests
En tant que data scientist dans un cabinet de conseil financier, vous avez développé un classificateur random forest qui classe les individus selon leur niveau de revenu. Vous devez maintenant expliquer le modèle en analysant l’importance des variables afin d’identifier les facteurs clés de prédiction du revenu, ce qui permettra un ciblage marketing plus précis et de meilleures décisions stratégiques.
matplotlib.pyplot a été importé sous le nom plt. X_train et y_train sont préchargés pour vous.
Cet exercice fait partie du cours
IA explicable en Python
Instructions
- Extrayez l’importance des variables à partir du
model. - Tracez les
feature_importances.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)
# Derive feature importances
feature_importances = ____
# Plot the feature importances
____
plt.show()