Visualizando a importância das colunas

Quando o modelo é treinado com conjuntos diferentes de colunas, o desempenho muda. Mas a importância da mesma coluna também muda dependendo do grupo em que ela está?

Os conjuntos de dados X2 e X3 foram criados com o seguinte código:

X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]

Entender como diferentes colunas são usadas para chegar a uma previsão de loan_status é muito importante para a interpretabilidade do modelo.

Os conjuntos de dados cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test estão carregados no workspace.

Este exercicio faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))

# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()

Editar e Executar Código