ComeçarComece de graça

Seleção de colunas e desempenho do modelo

A criação do conjunto de treinamento a partir de diferentes combinações de colunas afeta o modelo e os valores de importância das colunas. Uma seleção diferente de colunas também afeta as pontuações F-1, a combinação de precision e recall, do modelo? Você pode responder a essa pergunta treinando dois modelos diferentes em dois conjuntos diferentes de colunas e verificando o desempenho.

A previsão imprecisa de inadimplência como não inadimplência pode resultar em perdas inesperadas se a probabilidade de inadimplência para esses empréstimos for muito baixa. Você pode usar a pontuação F-1 para inadimplência para ver como os modelos preveem com precisão a inadimplência.

Os dados de crédito, cr_loan_prep e os dois conjuntos de colunas de treinamento X e X2 foram carregados no espaço de trabalho. Os modelos gbt e gbt2 já foram treinados.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))
Editar e executar o código