Modellspezifikation
Die Funktion stepAIC() liefert – wie du im vorherigen Video gesehen hast – ein reduziertes Modell zurück. Jetzt möchtest du diese Methode auf den Übungsdatensatz defaultData anwenden.
Der vorbereitete Datensatz steht dir in deiner Umgebung zur Verfügung. Außerdem ist das Paket MASS geladen und das zuvor erstellte Logit-Modell logitModelFull ist für dich definiert. Beachte auch, dass wir die Größe des Datensatzes reduziert haben, da die schrittweise Modellauswahl bei größeren Datensätzen und komplexeren Modellen viel Zeit in Anspruch nehmen kann.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Verwende die Funktion
stepAIC(). Setzetrace = 0, da du keine Ausgabe für den gesamten Modellauswahlprozess erhalten möchtest. Speichere das Ergebnis im ObjektlogitModelNew. - Nutze anschließend die Funktion
summary(), um dirlogitModelNewanzusehen. Du kannst die Warnmeldung in diesem Fall ignorieren. Schau dir an, was sich geändert hat, und verstehe die Ergebnisse. - Die Formel wird in einem Objekt gespeichert, damit du die gesamte Gleichung später nicht noch einmal eintippen musst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(MASS)
# The old (full) model
logitModelFull <- glm(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = binomial, defaultData)
#Build the new model
logitModelNew <- stepAIC(___,___)
#Look at the model
summary(logitModelNew)
# Save the formula of the new model (it will be needed for the out-of-sample part)
formulaLogit <- as.formula(summary(logitModelNew)$call)
formulaLogit