A tabela de estratégia e a curva de estratégia
Repetindo os cálculos que você fez no exercício anterior para várias taxas de aceitação, você pode obter uma tabela de estratégia. Essa tabela pode ser uma ferramenta útil para bancos, pois oferece uma visão melhor para definir uma estratégia de aceitação.
Você já sabe calcular a taxa de inadimplência para uma certa taxa de aceitação, então a função strategy_bank foi escrita e carregada no seu workspace para agilizar as coisas. Essa função calcula o cut-off e a taxa de inadimplência para taxas de aceitação que são múltiplos de 5% (0%, 5%, 10%, …).
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- Dê uma olhada na função
strategy_bank. - O vetor
predictions_cloglogcontém probabilidades previstas de default usando o modelo cloglog que você usou no capítulo 2; o vetorpredictions_loss_matrixcontém as probabilidades previstas de default usando a árvore podada com uma matriz de perdas (construída anteriormente no capítulo 3). Aplique a funçãostrategy_banka cada um dos vetores de previsão e atribua os nomesstrategy_cloglogestrategy_loss_matrix, respectivamente. - As tabelas de estratégia podem ser obtidas usando os nomes dos objetos em combinação com
$table. - As curvas de estratégia já foram plotadas para você. A curva de estratégia do modelo de árvore mostra um comportamento bem estranho. Por causa da estrutura das árvores de classificação, você pode ter uma chance maior de ver "saltos" esquisitos aqui. Além disso, a árvore com matriz de perdas era bem grande, então isso pode ser resultado de overfitting!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Have a look at the function strategy_bank
# Apply the function strategy_bank to both predictions_cloglog and predictions_loss_matrix
# Obtain the strategy tables for both prediction-vectors
# Plot the strategy functions
par(mfrow = c(1,2))
plot(strategy_cloglog$accept_rate, strategy_cloglog$bad_rate,
type = "l", xlab = "Acceptance rate", ylab = "Bad rate",
lwd = 2, main = "logistic regression")
plot(strategy_loss_matrix$accept_rate, strategy_loss_matrix$bad_rate,
type = "l", xlab = "Acceptance rate",
ylab = "Bad rate", lwd = 2, main = "tree")