In-Sample-Fit: Vollständiges Modell

Es ist wieder Coding-Zeit, das heißt, wir arbeiten erneut mit dem Übungsdatensatz defaultData.

Du willst jetzt wissen, wie gut dein Modell abschneidet, indem du die Accuracy berechnest. Dafür brauchst du zuerst eine Konfusionsmatrix.

Nimm zunächst das logitModelFull. Das Modell ist bereits spezifiziert und befindet sich in deiner Umgebung.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing-Analytics in R

Kurs anzeigen

Anleitung zur Übung

Verwende predict(), um für jede Kundin bzw. jeden Kunden die Ausfallwahrscheinlichkeit zu erhalten.
Um die Konfusionsmatrix zu erstellen, nutze die Funktion confusion.matrix() aus SDMTools. Beachte, dass SDMTools nicht mehr über CRAN verfügbar ist. Wenn du das zu Hause üben möchtest, kannst du das Paket mit remotes::install_version("SDMTools", "1.1-221.2") installieren. Damit erhältst du die Version von SDMTools, die in diesem Kurs verwendet wird.
Wähle einen üblichen Schwellenwert von 0,5.
Berechne die Accuracy mithilfe der Konfusionsmatrix.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Make predictions using the full Model
defaultData$predFull <- predict(logitModelFull, type = ___, na.action = ___)

# Construct the in-sample confusion matrix
confMatrixModelFull <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelFull

# Calculate the accuracy for the full Model
accuracyFull <- sum(diag(___)) / ___(___)
accuracyFull

Code bearbeiten und ausführen