Visualiser l’importance des colonnes
Lorsque le modèle est entraîné sur différents ensembles de colonnes, les performances changent. Mais l’importance d’une même colonne varie-t-elle selon le groupe auquel elle appartient ?
Les jeux de données X2 et X3 ont été créés avec le code suivant :
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Comprendre comment différentes colonnes sont utilisées pour prédire loan_status est essentiel pour l’interprétabilité du modèle.
Les jeux de données cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sont chargés dans l’espace de travail.
Cet exercice fait partie du cours
<cours>Modélisation du risque de crédit en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()