Especificação do modelo
A função stepAIC() retorna um modelo reduzido, como você acabou de ver no vídeo anterior. Agora, você vai aplicar esse método ao conjunto de dados do exercício, defaultData.
O conjunto de dados preparado está disponível no seu ambiente. Além disso, o pacote MASS já está carregado e o modelo logístico logitModelFull que você criou anteriormente está definido para você. Observe também que reduzimos o tamanho do conjunto de dados, pois a seleção stepwise de modelos pode levar muito tempo com conjuntos maiores e modelos mais complexos.
Este exercício faz parte do curso
Machine Learning for Marketing Analytics in R
Instruções do exercício
- Use a função
stepAIC(). Definatrace = 0, já que você não quer obter a saída de todo o processo de seleção do modelo. Salve o resultado no objetologitModelNew. - Em seguida, use a função
summary()para analisarlogitModelNew. Nesta situação, você pode ignorar a mensagem de aviso. Siga em frente e veja o que mudou. Entenda os resultados. - A fórmula é salva em um objeto para que você não precise digitar toda a equação novamente quando quiser usá-la mais tarde.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
library(MASS)
# The old (full) model
logitModelFull <- glm(PaymentDefault ~ limitBal + sex + education + marriage +
age + pay1 + pay2 + pay3 + pay4 + pay5 + pay6 + billAmt1 +
billAmt2 + billAmt3 + billAmt4 + billAmt5 + billAmt6 + payAmt1 +
payAmt2 + payAmt3 + payAmt4 + payAmt5 + payAmt6,
family = binomial, defaultData)
#Build the new model
logitModelNew <- stepAIC(___,___)
#Look at the model
summary(logitModelNew)
# Save the formula of the new model (it will be needed for the out-of-sample part)
formulaLogit <- as.formula(summary(logitModelNew)$call)
formulaLogit