Modellspezifikation und -schätzung
Du hast den Befehl glm() für die Durchführung einer logistischen Regression kennengelernt. glm() steht für Generalized Linear Model und bietet eine ganze Familie von Regressionsmodellen.
Nutze für diese Programmieraufgabe den Übungsdatensatz. Die Daten defaultData, die du für diese Übung brauchst, sind in deiner Umgebung verfügbar und bereit fürs Modellieren.
Diese Übung ist Teil des Kurses
<Kurs>Machine Learning für Marketing-Analytics in R</Kurs>Übungsanweisungen
- Verwende die Funktion
glm(), um mit einer logistischen Regression die Wahrscheinlichkeit zu modellieren, dass ein Kunde mit seiner Zahlung in Verzug gerät. Nimm alle erklärenden Variablen des Datensatzes auf und gib an, welche Daten verwendet werden sollen. - Vergiss nicht, das Argument
familyanzugeben. - Extrahiere die Koeffizienten aus dem Modell, wandle sie anschließend in Odds Ratios um und runde sie.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp