Den optimalen Schwellenwert finden
Stell dir vor, du führst eine Kampagne durch, um zu verhindern, dass Kundinnen und Kunden in Verzug geraten (default). Deine Vorhersagen helfen dir, die Kampagne zu planen. Dabei ist die Wahl des Schwellenwerts entscheidend für die Ergebnisse. Wenn du die Kosten und den Nutzen deiner Kampagne kennst, kannst du empirisch prüfen, welcher Schwellenwert am sinnvollsten ist. In dieser Übung betrachten wir folgendes Szenario:
Wenn ein Kunde oder eine Kundin dank unserer Kampagne nicht in Verzug gerät, d. h. wenn wir den Verzug korrekt vorhergesagt haben (true positive), erhalten wir 1000 €. Wenn wir die Kampagne jedoch auf jemanden ausrichten, der oder die ohnehin nicht in Verzug geraten wäre, d. h. wenn wir fälschlicherweise einen Verzug vorhergesagt haben (false positive), entstehen Kosten von 250 €.
Aus der letzten Übung wissen wir, dass das eingeschränkte Modell das beste war. Berechne also nur für dieses Modell den optimalen Schwellenwert. Die Vorhersagen stehen in der Spalte predNew des Dataframes defaultData. Verwende das Paket SDMTools.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(SDMTools)
# Confusion matrix with threshold 0.5
confMat <- confusion.matrix(defaultData$PaymentDefault,
defaultData$predNew,
threshold = ___)
confMat