In-Sample-Fit: Vollständiges Modell
Es ist wieder Coding-Zeit, das heißt, wir arbeiten erneut mit dem Übungsdatensatz defaultData.
Du willst jetzt wissen, wie gut dein Modell abschneidet, indem du die Accuracy berechnest. Dafür brauchst du zuerst eine Konfusionsmatrix.
Nimm zunächst das logitModelFull. Das Modell ist bereits spezifiziert und befindet sich in deiner Umgebung.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Verwende
predict(), um für jede Kundin bzw. jeden Kunden die Ausfallwahrscheinlichkeit zu erhalten. - Um die Konfusionsmatrix zu erstellen, nutze die Funktion
confusion.matrix()ausSDMTools. Beachte, dassSDMToolsnicht mehr über CRAN verfügbar ist. Wenn du das zu Hause üben möchtest, kannst du das Paket mitremotes::install_version("SDMTools", "1.1-221.2")installieren. Damit erhältst du die Version vonSDMTools, die in diesem Kurs verwendet wird. - Wähle einen üblichen Schwellenwert von 0,5.
- Berechne die Accuracy mithilfe der Konfusionsmatrix.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Make predictions using the full Model
defaultData$predFull <- predict(logitModelFull, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelFull <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelFull
# Calculate the accuracy for the full Model
accuracyFull <- sum(diag(___)) / ___(___)
accuracyFull