Aan de slagGa gratis aan de slag

De optimale drempelwaarde bepalen

Stel, je voert een campagne om te voorkomen dat klanten in gebreke blijven (default). Je kunt je campagne inrichten met behulp van je voorspellingen. Daarbij is de keuze van de drempelwaarde cruciaal voor je resultaten. Als je de kosten en opbrengsten van je campagne kent, kun je empirisch nagaan welke drempel het meest logisch is. In deze oefening hebben we het volgende scenario:

Als een klant dankzij onze campagne niet in gebreke blijft, dus als we de default correct hebben voorspeld (true positive), krijgen we een beloning van 1000€. Richten we de campagne echter op een klant die toch al niet in gebreke zou blijven, dus als we onterecht voorspellen (false positive) dat de klant in gebreke blijft, dan maken we 250€ aan kosten.

Uit de vorige oefening weten we dat het beperkte model het beste was. Bereken de optimale drempelwaarde dus alleen voor dat model. De voorspellingen staan in de kolom predNew van de dataframe defaultData. Gebruik het pakket SDMTools.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

library(SDMTools)

# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
                               defaultData$predNew, 
                               threshold = ___)
confMat
Code bewerken en uitvoeren