Seleção de colunas e desempenho do modelo
Criar o conjunto de treinamento a partir de diferentes combinações de colunas afeta o modelo e os valores de importância das colunas. Uma seleção diferente de colunas também afeta os escores F-1, a combinação de precision e recall, do modelo? Você pode responder a essa pergunta treinando dois modelos diferentes em dois conjuntos de colunas diferentes e verificando o desempenho.
Classificar incorretamente inadimplências como não inadimplências pode gerar perdas inesperadas, especialmente se a probabilidade de inadimplência desses empréstimos era muito baixa. Você pode usar o F-1 para inadimplências para ver como os modelos acertam as previsões de inadimplência.
Os dados de crédito, cr_loan_prep, e os dois conjuntos de colunas de treinamento, X e X2, já foram carregados no workspace. Os modelos gbt e gbt2 já foram treinados.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))