Modellspezifikation und -schätzung
Du hast den Befehl glm() für die Durchführung einer logistischen Regression kennengelernt. glm() steht für Generalized Linear Model und bietet eine ganze Familie von Regressionsmodellen.
Nutze für diese Programmieraufgabe den Übungsdatensatz. Die Daten defaultData, die du für diese Übung brauchst, sind in deiner Umgebung verfügbar und bereit fürs Modellieren.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing-Analytics in R
Anleitung zur Übung
- Verwende die Funktion
glm(), um mit einer logistischen Regression die Wahrscheinlichkeit zu modellieren, dass ein Kunde mit seiner Zahlung in Verzug gerät. Nimm alle erklärenden Variablen des Datensatzes auf und gib an, welche Daten verwendet werden sollen. - Vergiss nicht, das Argument
familyanzugeben. - Extrahiere die Koeffizienten aus dem Modell, wandle sie anschließend in Odds Ratios um und runde sie.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp