Seleção de colunas e desempenho do modelo

Criar o conjunto de treinamento a partir de diferentes combinações de colunas afeta o modelo e os valores de importância das colunas. Uma seleção diferente de colunas também afeta os escores F-1, a combinação de precision e recall, do modelo? Você pode responder a essa pergunta treinando dois modelos diferentes em dois conjuntos de colunas diferentes e verificando o desempenho.

Classificar incorretamente inadimplências como não inadimplências pode gerar perdas inesperadas, especialmente se a probabilidade de inadimplência desses empréstimos era muito baixa. Você pode usar o F-1 para inadimplências para ver como os modelos acertam as previsões de inadimplência.

Os dados de crédito, cr_loan_prep, e os dois conjuntos de colunas de treinamento, X e X2, já foram carregados no workspace. Os modelos gbt e gbt2 já foram treinados.

Este exercicio faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))

Editar e Executar Código