Modelspecificatie en -schatting
Je hebt het glm()-commando gezien om een logistische regressie uit te voeren. glm() staat voor generalized linear model en biedt een hele familie aan regressiemodellen.
Gebruik voor deze code-opdracht de oefengegevens. De gegevens defaultData die je nodig hebt voor deze oefening staan al in je omgeving en zijn klaar voor modelleren.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Gebruik de functie
glm()om met een logistische regressie de kans te modelleren dat een klant zijn betaling niet nakomt. Neem alle verklarende variabelen uit de gegevensset op en specificeer welke data gebruikt moeten worden. - Vergeet niet het argument
familyte specificeren. - Haal de coëfficiënten uit het model, zet ze vervolgens om naar odds ratio’s en rond af.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build logistic regression model
logitModelFull <- ___(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = ___, data = ___)
# Take a look at the model
___(logitModelFull)
# Take a look at the odds ratios
coefsexp <- ___(logitModelFull) %>% ___ %>% round(2)
coefsexp