Encontrando o limiar ideal
Imagine que você está rodando uma campanha com o objetivo de evitar que clientes entrem em inadimplência (default). Você pode planejar sua campanha com a ajuda das suas previsões. Para isso, a escolha do limiar é essencial para seus resultados. Se você conhece os custos e as recompensas da sua campanha, pode verificar empiricamente qual limiar é mais razoável. Neste exercício, temos o seguinte cenário:
Se um cliente não entra em default por causa da nossa campanha, ou seja, se previmos o default corretamente (verdadeiro positivo), recebemos uma recompensa de 1000€. Porém, se direcionarmos a campanha para um cliente que não entraria em default de qualquer forma, isto é, se previmos falsamente que o cliente (falso positivo) iria entrar em default, teremos um custo de 250€.
No exercício anterior vimos que o modelo restrito foi o melhor. Então calcule apenas o limiar ideal para esse modelo. As previsões estão armazenadas na coluna predNew do dataframe defaultData. Use o pacote SDMTools.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
library(SDMTools)
# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
defaultData$predNew,
threshold = ___)
confMat