Importância da coluna e previsão de inadimplência
Ao usar vários conjuntos de treinamento com muitos grupos diferentes de colunas, é importante que você fique atento a quais colunas são importantes e quais não são. Pode ser caro ou demorado manter um conjunto de colunas, mesmo que elas não tenham nenhum impacto em loan_status.
Os dados do site X para este exercício foram criados com o seguinte código:
X = cr_loan_prep[['person_income','loan_int_rate',
'loan_percent_income','loan_amnt',
'person_home_ownership_MORTGAGE','loan_grade_F']]
Treine um modelo XGBClassifier() com esses dados e verifique a importância da coluna para ver o desempenho de cada uma delas para prever loan_status.
O conjunto de dados cr_loan_pret, juntamente com X_train e y_train, foi carregado no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Crie e treine um modelo
XGBClassifier()nos conjuntos de treinamentoX_trainey_traine armazene-o comoclf_gbt. - Imprima as importações de colunas para as colunas em
clf_gbtusando.get_booster()e.get_score().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))
# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))