Ajuster glmnet avec un trainControl personnalisé
Maintenant que vous avez un objet trainControl personnalisé, ajustez un modèle glmnet au jeu de données "don't overfit". Rappelez-vous de la vidéo que glmnet est une extension du modèle de régression linéaire généralisée (ou glm) qui impose des contraintes sur l'amplitude des coefficients pour éviter le surapprentissage. On parle plus souvent de régression « pénalisée », une technique très utile pour les jeux de données avec de nombreux prédicteurs et peu d'observations.
glmnet peut ajuster deux types de modèles pénalisés, contrôlés par le paramètre alpha :
- Régression Ridge (ou
alpha = 0) - Régression Lasso (ou
alpha = 1)
Vous allez maintenant ajuster un modèle glmnet au jeu de données "don't overfit" en utilisant les paramètres par défaut fournis par le package caret.
Cet exercice fait partie du cours
Machine Learning avec caret en R
Instructions
- Entraînez un modèle
glmnetappelémodelsur les donnéesoverfit. Utilisez letrainControlpersonnalisé de l’exercice précédent (myControl). La variableyest la variable réponse et toutes les autres variables sont explicatives. - Affichez le modèle dans la console.
- Utilisez la fonction
max()pour trouver le maximum de la statistique ROC contenue quelque part dansmodel[["results"]].
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit glmnet model: model
model <- train(
___,
___,
method = "glmnet",
trControl = ___
)
# Print model to console
# Print maximum ROC statistic