LoslegenKostenlos loslegen

Modellspezifikation und -schätzung

Du hast den Befehl glm() für die Durchführung einer logistischen Regression kennengelernt. glm() steht für Generalized Linear Model und bietet eine ganze Familie von Regressionsmodellen.

Nutze für diese Programmieraufgabe den Übungsdatensatz. Die Daten defaultData, die du für diese Übung brauchst, sind in deiner Umgebung verfügbar und bereit fürs Modellieren.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing-Analytics in R

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Funktion glm(), um mit einer logistischen Regression die Wahrscheinlichkeit zu modellieren, dass ein Kunde mit seiner Zahlung in Verzug gerät. Nimm alle erklärenden Variablen des Datensatzes auf und gib an, welche Daten verwendet werden sollen.
  • Vergiss nicht, das Argument family anzugeben.
  • Extrahiere die Koeffizienten aus dem Modell, wandle sie anschließend in Odds Ratios um und runde sie.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
                   age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 + 
                   billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 + 
                   payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6, 
                family = ___, data = ___)

# Take a look at the model
___(logitModelFull)

# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp
Code bearbeiten und ausführen