Aan de slagGa gratis aan de slag

Modelspecificatie en -schatting

Je hebt het glm()-commando gezien om een logistische regressie uit te voeren. glm() staat voor generalized linear model en biedt een hele familie aan regressiemodellen.

Gebruik voor deze code-opdracht de oefengegevens. De gegevens defaultData die je nodig hebt voor deze oefening staan al in je omgeving en zijn klaar voor modelleren.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Gebruik de functie glm() om met een logistische regressie de kans te modelleren dat een klant zijn betaling niet nakomt. Neem alle verklarende variabelen uit de gegevensset op en specificeer welke data gebruikt moeten worden.
  • Vergeet niet het argument family te specificeren.
  • Haal de coëfficiënten uit het model, zet ze vervolgens om naar odds ratio’s en rond af.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
                   age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 + 
                   billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 + 
                   payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6, 
                family = ___, data = ___)

# Take a look at the model
___(logitModelFull)

# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp
Code bewerken en uitvoeren