ComeçarComece de graça

Como limiares afetam o desempenho

Definir o limiar como 0.4 mostrou resultados promissores na avaliação do modelo. Agora você pode avaliar o impacto financeiro usando o recall de inadimplência, que é obtido do relatório de classificação com a função precision_recall_fscore_support().

Para isso, você vai estimar o valor da perda inesperada usando o recall de inadimplência para descobrir qual proporção de inadimplências você não capturou com o novo limiar. Esse será um valor em dólares que indica quanto você perderia se todas as inadimplências não identificadas ocorressem de uma só vez.

O valor médio do empréstimo, avg_loan_amnt, já foi calculado e está disponível no workspace junto com preds_df e y_test.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercício

  • Atribua novamente os valores de loan_status usando o limiar 0.4.
  • Armazene o número de inadimplências em preds_df selecionando o segundo valor de value_counts e salve como num_defaults.
  • Obtenha a taxa de recall de inadimplência da matriz de classificação e salve como default_recall.
  • Estime a perda inesperada a partir do novo recall de inadimplência multiplicando 1 - default_recall pelo valor médio do empréstimo e pelo número de empréstimos inadimplentes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)

# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]

# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]

# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))
Editar e executar o código