Criação de um modelo de regressão stepwise
Na ausência de conhecimento especializado no assunto, a regressão por etapas pode ajudar na busca dos preditores mais importantes do resultado de interesse.
Neste exercício, você usará uma abordagem de avanço gradual para adicionar preditores ao modelo, um a um, até que nenhum benefício adicional seja observado. O conjunto de dados donors
foi carregado para você.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções de exercício
- Use a interface de fórmula do R com
glm()
para especificar o modelo básico sem preditores. Defina a variável explicativa como1
. - Use a interface de fórmula do R novamente com
glm()
para especificar o modelo com todos os preditores. - Aplique o site
step()
a esses modelos para realizar a regressão progressiva por etapas. Defina o primeiro argumento comonull_model
e definadirection = "forward"
. Isso pode demorar um pouco (até 10 ou 15 segundos), pois o computador precisa ajustar vários modelos diferentes para realizar a seleção por etapas. - Crie um vetor de probabilidades previstas usando a função
predict()
. - Trace a curva ROC com
roc()
eplot()
e calcule o AUC do modelo stepwise comauc()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Specify a null model with no predictors
null_model <- ___(___, data = ___, family = "___")
# Specify the full model using all of the potential predictors
full_model <- ___
# Use a forward stepwise algorithm to build a parsimonious model
step_model <- step(___, scope = list(lower = null_model, upper = full_model), direction = "___")
# Estimate the stepwise donation probability
step_prob <- ___
# Plot the ROC of the stepwise model
library(pROC)
ROC <- ___
plot(___, col = "red")
auc(___)