Visualizando a importância das colunas
Quando o modelo é treinado com conjuntos diferentes de colunas, o desempenho muda. Mas a importância da mesma coluna também muda dependendo do grupo em que ela está?
Os conjuntos de dados X2 e X3 foram criados com o seguinte código:
X2 = cr_loan_prep[['loan_int_rate','person_emp_length']]
X3 = cr_loan_prep[['person_income','loan_int_rate','loan_percent_income']]
Entender como diferentes colunas são usadas para chegar a uma previsão de loan_status é muito importante para a interpretabilidade do modelo.
Os conjuntos de dados cr_loan_prep, X2_train, X2_test, X3_train, X3_test, y_train, y_test estão carregados no workspace.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Train a model on the X data with 2 columns
____ = xgb.____().____(____,np.ravel(____))
# Plot the column importance for this model
xgb.____(____, importance_type = 'weight')
plt.____()