In-Sample-Fit: Restriktiertes Modell
Du hast die Genauigkeit für logitModelFull berechnet. Es ist sehr wichtig, das für alle deine Modellkandidaten zu tun.
Daher ist logitModelNew spezifiziert und in deiner Umgebung verfügbar.
Beim Vergleich der Werte der verschiedenen Modelle miteinander gilt: Falls unterschiedliche Modelle die gleiche Genauigkeit haben, wähle immer das Modell mit weniger erklärenden Variablen.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
Wiederhole die gleichen Schritte wie in der vorherigen Übung für das neue Modell.
Verwende
predict(), um für jede Kundin bzw. jeden Kunden die Ausfallwahrscheinlichkeit der Zahlung zu erhalten.Berechne anschließend eine Konfusionsmatrix mit demselben Schwellenwert von 0,5 für die Klassifikation. Beachte, dass
SDMToolsnicht mehr über CRAN heruntergeladen werden kann. Installiere es stattdessen überremotes::install_version("SDMTools", "1.1-221.2").Berechne die Genauigkeit des restriktierten Modells und vergleiche sie mit der Genauigkeit des vollen Modells. Du führst deine Analyse nur mit dem überlegenen Modell fort.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the accuracy for 'logitModelNew'
# Make prediction
defaultData$predNew <- predict(logitModelNew, type = ___, na.action = ___)
# Construct the in-sample confusion matrix
confMatrixModelNew <- confusion.matrix(defaultData$___,defaultData$___, threshold = ___)
confMatrixModelNew
# Calculate the accuracy...
accuracyNew <- sum(diag(___)) / ___(___)
accuracyNew
# and compare it to the full model's accuracy
accuracyFull