Aan de slagGa gratis aan de slag

Modelspecificatie

De functie stepAIC() geeft een gereduceerd model terug, zoals je net in de vorige video hebt gezien. Nu wil je deze methode toepassen op de oefengegevensset defaultData.

De voorbereide gegevensset staat al in je omgeving. Daarnaast is het pakket MASS geladen en is het eerder gebouwde logitmodel logitModelFull voor je gedefinieerd. Let er ook op dat we de grootte van de gegevensset hebben verkleind, omdat stapsgewijze modelselectie lang kan duren bij grotere gegevenssets en complexere modellen.

Deze oefening maakt deel uit van de cursus

Machine Learning for Marketing Analytics in R

Cursus bekijken

Oefeninstructies

  • Gebruik de functie stepAIC(). Zet trace = 0, omdat je geen output wilt voor het hele modelselectieproces. Sla het resultaat op in het object logitModelNew.
  • Gebruik daarna de functie summary() om logitModelNew te bekijken. Je kunt de waarschuwing in dit geval negeren. Ga na wat er is veranderd en probeer de resultaten te begrijpen.
  • De formule wordt opgeslagen in een object, zodat je de hele vergelijking later niet opnieuw hoeft te typen als je die nog eens wilt gebruiken.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

library(MASS)
# The old (full) model
logitModelFull <- glm(PaymentDefault ~ limitBal + sex + education + marriage +
                   age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 + 
                   billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 + 
                   payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6, 
                 family = binomial, defaultData)

#Build the new model
logitModelNew <- stepAIC(___,___) 

#Look at the model
summary(logitModelNew) 

# Save the formula of the new model (it will be needed for the out-of-sample part) 
formulaLogit <- as.formula(summary(logitModelNew)$call)
formulaLogit
Code bewerken en uitvoeren