Construir un modelo de regresión por pasos
En ausencia de experiencia en la materia, la regresión por pasos puede ayudar en la búsqueda de los predictores más importantes del resultado de interés.
En este ejercicio, utilizarás un enfoque progresivo para añadir predictores al modelo uno a uno hasta que no se observe ningún beneficio adicional. Se ha cargado para ti el conjunto de datos donors
.
Este ejercicio forma parte del curso
Aprendizaje supervisado en R: Clasificación
Instrucciones del ejercicio
- Utiliza la interfaz de fórmulas de R con
glm()
para especificar el modelo base sin predictores. Establece la variable explicativa igual a1
. - Utiliza de nuevo la interfaz de fórmulas de R con
glm()
para especificar el modelo con todos los predictores. - Aplica
step()
a estos modelos para realizar una regresión por pasos hacia delante. Establece el primer argumento ennull_model
y establecedirection = "forward"
. Esto puede llevar un rato (hasta 10 ó 15 segundos), ya que tu ordenador tiene que ajustar bastantes modelos diferentes para realizar la selección por pasos. - Crea un vector de probabilidades predichas utilizando la función
predict()
. - Traza la curva ROC con
roc()
yplot()
y calcula la AUC del modelo escalonado conauc()
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Specify a null model with no predictors
null_model <- ___(___, data = ___, family = "___")
# Specify the full model using all of the potential predictors
full_model <- ___
# Use a forward stepwise algorithm to build a parsimonious model
step_model <- step(___, scope = list(lower = null_model, upper = full_model), direction = "___")
# Estimate the stepwise donation probability
step_prob <- ___
# Plot the ROC of the stepwise model
library(pROC)
ROC <- ___
plot(___, col = "red")
auc(___)