Visualização da importância da coluna
Quando o modelo é treinado em diferentes conjuntos de colunas, o desempenho é alterado, mas a importância da mesma coluna muda dependendo do grupo em que ela se encontra?
Os conjuntos de dados X2
e X3
foram criados com o seguinte código:
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Entender como as diferentes colunas são usadas para chegar a uma previsão de loan_status
é muito importante para a interpretabilidade do modelo.
Os conjuntos de dados cr_loan_prep
, X2_train
, X2_test
, X3_train
, X3_test
, y_train
, y_test
são carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()