CommencerCommencer gratuitement

Calcul de l’importance des variables avec les random forests

En tant que data scientist dans un cabinet de conseil financier, vous avez développé un classificateur random forest qui classe les individus selon leur niveau de revenu. Vous devez maintenant expliquer le modèle en analysant l’importance des variables afin d’identifier les facteurs clés de prédiction du revenu, ce qui permettra un ciblage marketing plus précis et de meilleures décisions stratégiques.

matplotlib.pyplot a été importé sous le nom plt. X_train et y_train sont préchargés pour vous.

Cet exercice fait partie du cours

IA explicable en Python

Afficher le cours

Instructions

  • Extrayez l’importance des variables à partir du model.
  • Tracez les feature_importances.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# Derive feature importances
feature_importances = ____

# Plot the feature importances
____
plt.show()
Modifier et exécuter le code