Construire un modèle de régression pas à pas
En l'absence d'expertise en la matière, la régression par étapes peut aider à la recherche des prédicteurs les plus importants du résultat en question.
Dans cet exercice, vous utiliserez une approche progressive pour ajouter des prédicteurs au modèle, un par un, jusqu'à ce qu'aucun avantage supplémentaire ne soit constaté. L'ensemble de données donors
a été chargé pour vous.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Utilisez l'interface de formule R avec
glm()
pour spécifier le modèle de base sans prédicteurs. Fixez la variable explicative à1
. - Utilisez à nouveau l'interface de formule R avec
glm()
pour spécifier le modèle avec tous les prédicteurs. - Appliquez
step()
à ces modèles pour effectuer une régression progressive. Fixez le premier argument ànull_model
et fixezdirection = "forward"
. Cette opération peut prendre un certain temps (jusqu'à 10 ou 15 secondes), car votre ordinateur doit adapter un certain nombre de modèles différents pour effectuer une sélection progressive. - Créez un vecteur de probabilités prédites à l'aide de la fonction
predict()
. - Tracez la courbe ROC avec
roc()
etplot()
et calculez AUC du modèle par étapes avecauc()
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Specify a null model with no predictors
null_model <- ___(___, data = ___, family = "___")
# Specify the full model using all of the potential predictors
full_model <- ___
# Use a forward stepwise algorithm to build a parsimonious model
step_model <- step(___, scope = list(lower = null_model, upper = full_model), direction = "___")
# Estimate the stepwise donation probability
step_prob <- ___
# Plot the ROC of the stepwise model
library(pROC)
ROC <- ___
plot(___, col = "red")
auc(___)