ComeçarComece de graça

Importância da coluna e previsão de inadimplência

Ao usar vários conjuntos de treinamento com muitos grupos diferentes de colunas, é importante que você fique atento a quais colunas são importantes e quais não são. Pode ser caro ou demorado manter um conjunto de colunas, mesmo que elas não tenham nenhum impacto em loan_status.

Os dados do site X para este exercício foram criados com o seguinte código:

X = cr_loan_prep[['person_income','loan_int_rate',

                  'loan_percent_income','loan_amnt',

                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Treine um modelo XGBClassifier() com esses dados e verifique a importância da coluna para ver o desempenho de cada uma delas para prever loan_status.

O conjunto de dados cr_loan_pret, juntamente com X_train e y_train, foi carregado no espaço de trabalho.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver curso

Instruções do exercício

  • Crie e treine um modelo XGBClassifier() nos conjuntos de treinamento X_train e y_train e armazene-o como clf_gbt.
  • Imprima as importações de colunas para as colunas em clf_gbt usando .get_booster() e .get_score().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create and train the model on the training data
____ = xgb.____().____(____,np.ravel(____))

# Print the column importances from the model
print(clf_gbt.____().____(importance_type = 'weight'))
Editar e executar o código