Visualiser l’importance des colonnes
Lorsque le modèle est entraîné sur différents ensembles de colonnes, les performances changent. Mais l’importance d’une même colonne varie-t-elle selon le groupe auquel elle appartient ?
Les jeux de données X2 et X3 ont été créés avec le code suivant :
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Comprendre comment différentes colonnes sont utilisées pour prédire loan_status est essentiel pour l’interprétabilité du modèle.
Les jeux de données cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test sont chargés dans l’espace de travail.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()