CommencerCommencez gratuitement

Visualiser l’importance des colonnes

Lorsque le modèle est entraîné sur différents ensembles de colonnes, les performances changent. Mais l’importance d’une même colonne varie-t-elle selon le groupe auquel elle appartient ?

Les jeux de données X2 et X3 ont été créés avec le code suivant :

X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]

Comprendre comment différentes colonnes sont utilisées pour prédire loan_status est essentiel pour l’interprétabilité du modèle.

Les jeux de données cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sont chargés dans l’espace de travail.

Cet exercice fait partie du cours

<cours>Modélisation du risque de crédit en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))

# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()
Modifier et exécuter le code