Encontrando o limiar ideal

Imagine que você está rodando uma campanha com o objetivo de evitar que clientes entrem em inadimplência (default). Você pode planejar sua campanha com a ajuda das suas previsões. Para isso, a escolha do limiar é essencial para seus resultados. Se você conhece os custos e as recompensas da sua campanha, pode verificar empiricamente qual limiar é mais razoável. Neste exercício, temos o seguinte cenário:

Se um cliente não entra em default por causa da nossa campanha, ou seja, se previmos o default corretamente (verdadeiro positivo), recebemos uma recompensa de 1000€. Porém, se direcionarmos a campanha para um cliente que não entraria em default de qualquer forma, isto é, se previmos falsamente que o cliente (falso positivo) iria entrar em default, teremos um custo de 250€.

No exercício anterior vimos que o modelo restrito foi o melhor. Então calcule apenas o limiar ideal para esse modelo. As previsões estão armazenadas na coluna predNew do dataframe defaultData. Use o pacote SDMTools.

Este exercício faz parte do curso

Machine Learning for Marketing Analytics in R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

library(SDMTools)

# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
                               defaultData$predNew, 
                               threshold = ___)
confMat

Editar e executar o código