Specificazione del modello
La funzione stepAIC() restituisce un modello ridotto, come hai visto nel video precedente. Ora vuoi applicare questo metodo al dataset dell'esercizio defaultData.
Il dataset preparato è disponibile nel tuo ambiente. Inoltre, il pacchetto MASS è caricato e il modello logit costruito in precedenza logitModelFull è già definito per te. Nota anche che abbiamo ridotto la dimensione dell'insieme di dati, perché l'esecuzione di una selezione stepwise del modello può richiedere molto tempo con insiemi di dati più grandi e modelli più complessi.
Questo esercizio fa parte del corso
Machine Learning per il Marketing Analytics in R
Istruzioni dell'esercizio
- Usa la funzione
stepAIC(). Impostatrace = 0, così non otterrai l'output di tutto il processo di selezione del modello. Salva il risultato nell'oggettologitModelNew. - Poi, usa la funzione
summary()per dare un'occhiata alogitModelNew. In questo caso puoi ignorare il messaggio di avviso. Vai avanti e guarda cosa è cambiato. Cerca di capire i risultati. - La formula è salvata in un oggetto, così non dovrai riscrivere tutta l'equazione quando vorrai usarla più tardi.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(MASS)
# The old (full) model
logitModelFull <- glm(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = binomial, defaultData)
#Build the new model
logitModelNew <- stepAIC(___,___)
#Look at the model
summary(logitModelNew)
# Save the formula of the new model (it will be needed for the out-of-sample part)
formulaLogit <- as.formula(summary(logitModelNew)$call)
formulaLogit