Relatório de classificação padrão
Chegou a hora de dar uma olhada mais de perto na avaliação do modelo. É aqui que a definição do limite da probabilidade de inadimplência ajudará você a analisar o desempenho do modelo por meio de relatórios de classificação.
A criação de um quadro de dados das probabilidades facilita o trabalho com elas, porque você pode usar todo o poder do pandas
. Aplique o limite aos dados e verifique as contagens de valores para ambas as classes de loan_status
para ver quantas previsões de cada uma estão sendo criadas. Isso ajudará você a ter uma visão das pontuações do relatório de classificação.
O conjunto de dados cr_loan_prep
, a regressão logística treinada clf_logistic
, os valores reais do status do empréstimo y_test
e as probabilidades previstas preds
são carregados no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Crie um quadro de dados apenas com as probabilidades de inadimplência do site
preds
chamadopreds_df
. - Reatribua os valores de
loan_status
com base em um limite de0.50
para probabilidade de inadimplência empreds_df
. - Imprima as contagens de valores do número de linhas para cada
loan_status
. - Imprima o relatório de classificação usando
y_test
epreds_df
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))