Como os limites afetam o desempenho
A definição do limite para 0.4
mostra resultados promissores para a avaliação do modelo. Agora você pode avaliar o impacto financeiro usando o recall padrão que é selecionado no relatório de classificação usando a função precision_recall_fscore_support()
.
Para isso, você estimará o valor da perda inesperada usando o recall de inadimplência para descobrir a proporção de inadimplência que não foi capturada com o novo limite. Esse será um valor em dólares que informa quanto você teria de perdas se todas as inadimplências não encontradas fossem inadimplentes de uma só vez.
O valor médio do empréstimo, avg_loan_amnt
, foi calculado e disponibilizado no espaço de trabalho junto com preds_df
e y_test
.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Reatribua os valores de
loan_status
usando o limiar0.4
. - Armazene o número de padrões em
preds_df
selecionando o segundo valor da contagem de valores e armazenando-o comonum_defaults
. - Obtenha a taxa de recuperação padrão da matriz de classificação e armazene-a como
default_recall
- Faça uma estimativa da perda inesperada do novo recall de inadimplência multiplicando
1 - default_recall
pelo valor médio do empréstimo e pelo número de empréstimos inadimplentes.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))