Como limiares afetam o desempenho
Definir o limiar como 0.4 mostrou resultados promissores na avaliação do modelo. Agora você pode avaliar o impacto financeiro usando o recall de inadimplência, que é obtido do relatório de classificação com a função precision_recall_fscore_support().
Para isso, você vai estimar o valor da perda inesperada usando o recall de inadimplência para descobrir qual proporção de inadimplências você não capturou com o novo limiar. Esse será um valor em dólares que indica quanto você perderia se todas as inadimplências não identificadas ocorressem de uma só vez.
O valor médio do empréstimo, avg_loan_amnt, já foi calculado e está disponível no workspace junto com preds_df e y_test.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Atribua novamente os valores de
loan_statususando o limiar0.4. - Armazene o número de inadimplências em
preds_dfselecionando o segundo valor devalue_countse salve comonum_defaults. - Obtenha a taxa de recall de inadimplência da matriz de classificação e salve como
default_recall. - Estime a perda inesperada a partir do novo recall de inadimplência multiplicando
1 - default_recallpelo valor médio do empréstimo e pelo número de empréstimos inadimplentes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))