Modelspecificatie
De functie stepAIC() geeft een gereduceerd model terug, zoals je net in de vorige video hebt gezien. Nu wil je deze methode toepassen op de oefengegevensset defaultData.
De voorbereide gegevensset staat al in je omgeving. Daarnaast is het pakket MASS geladen en is het eerder gebouwde logitmodel logitModelFull voor je gedefinieerd. Let er ook op dat we de grootte van de gegevensset hebben verkleind, omdat stapsgewijze modelselectie lang kan duren bij grotere gegevenssets en complexere modellen.
Deze oefening maakt deel uit van de cursus
Machine Learning for Marketing Analytics in R
Oefeninstructies
- Gebruik de functie
stepAIC(). Zettrace = 0, omdat je geen output wilt voor het hele modelselectieproces. Sla het resultaat op in het objectlogitModelNew. - Gebruik daarna de functie
summary()omlogitModelNewte bekijken. Je kunt de waarschuwing in dit geval negeren. Ga na wat er is veranderd en probeer de resultaten te begrijpen. - De formule wordt opgeslagen in een object, zodat je de hele vergelijking later niet opnieuw hoeft te typen als je die nog eens wilt gebruiken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(MASS)
# The old (full) model
logitModelFull <- glm(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = binomial, defaultData)
#Build the new model
logitModelNew <- stepAIC(___,___)
#Look at the model
summary(logitModelNew)
# Save the formula of the new model (it will be needed for the out-of-sample part)
formulaLogit <- as.formula(summary(logitModelNew)$call)
formulaLogit