CommencerCommencer gratuitement

Ajuster glmnet avec un trainControl personnalisé

Maintenant que vous avez un objet trainControl personnalisé, ajustez un modèle glmnet au jeu de données "don't overfit". Rappelez-vous de la vidéo que glmnet est une extension du modèle de régression linéaire généralisée (ou glm) qui impose des contraintes sur l'amplitude des coefficients pour éviter le surapprentissage. On parle plus souvent de régression « pénalisée », une technique très utile pour les jeux de données avec de nombreux prédicteurs et peu d'observations.

glmnet peut ajuster deux types de modèles pénalisés, contrôlés par le paramètre alpha :

  • Régression Ridge (ou alpha = 0)
  • Régression Lasso (ou alpha = 1)

Vous allez maintenant ajuster un modèle glmnet au jeu de données "don't overfit" en utilisant les paramètres par défaut fournis par le package caret.

Cet exercice fait partie du cours

Machine Learning avec caret en R

Afficher le cours

Instructions

  • Entraînez un modèle glmnet appelé model sur les données overfit. Utilisez le trainControl personnalisé de l’exercice précédent (myControl). La variable y est la variable réponse et toutes les autres variables sont explicatives.
  • Affichez le modèle dans la console.
  • Utilisez la fonction max() pour trouver le maximum de la statistique ROC contenue quelque part dans model[["results"]].

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit glmnet model: model
model <- train(
  ___, 
  ___,
  method = "glmnet",
  trControl = ___
)

# Print model to console


# Print maximum ROC statistic
Modifier et exécuter le code