Visualiser l’importance des colonnes

Lorsque le modèle est entraîné sur différents ensembles de colonnes, les performances changent. Mais l’importance d’une même colonne varie-t-elle selon le groupe auquel elle appartient ?

Les jeux de données X2 et X3 ont été créés avec le code suivant :

X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]

Comprendre comment différentes colonnes sont utilisées pour prédire loan_status est essentiel pour l’interprétabilité du modèle.

Les jeux de données cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sont chargés dans l’espace de travail.

Cet exercice fait partie du cours

Modélisation du risque de crédit en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))

# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()

Modifier et exécuter le code