Seleção de colunas e desempenho do modelo
A criação do conjunto de treinamento a partir de diferentes combinações de colunas afeta o modelo e os valores de importância das colunas. Uma seleção diferente de colunas também afeta as pontuações F-1, a combinação de precision
e recall
, do modelo? Você pode responder a essa pergunta treinando dois modelos diferentes em dois conjuntos diferentes de colunas e verificando o desempenho.
A previsão imprecisa de inadimplência como não inadimplência pode resultar em perdas inesperadas se a probabilidade de inadimplência para esses empréstimos for muito baixa. Você pode usar a pontuação F-1 para inadimplência para ver como os modelos preveem com precisão a inadimplência.
Os dados de crédito, cr_loan_prep
e os dois conjuntos de colunas de treinamento X
e X2
foram carregados no espaço de trabalho. Os modelos gbt
e gbt2
já foram treinados.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))