CommencerCommencer gratuitement

Régularisation manuelle avec Lasso

Le jeu de données attrition comporte 30 variables. Votre service des ressources humaines vous demande de construire un modèle facile à interpréter et à maintenir. Il souhaite en particulier réduire le nombre de variables afin que votre modèle soit aussi interprétable que possible.

Dans cet exercice, vous allez utiliser Lasso pour réduire automatiquement le nombre de variables de votre modèle. Pour cette première tentative, vous indiquerez manuellement une pénalité et observerez le comportement du modèle.

Les données train et test, ainsi qu'une recipe de base, sont déjà chargées pour vous.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Configurez votre modèle de régression logistique pour utiliser le moteur glmnet.
  • Définissez les arguments pour exécuter Lasso avec une pénalité de 0,06.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

model_lasso_manual <- logistic_reg() %>%

# Set the glmnet engine for your logistic regression model
  ___(___) %>%

# Set arguments to run Lasso with a penalty of 0.06
  set_args(mixture = ___, ___ = ___)

workflow_lasso_manual <- workflow() %>%
  add_model(model_lasso_manual) %>%
  add_recipe(recipe)

fit_lasso_manual <- workflow_lasso_manual %>% 
  fit(train)

tidy(fit_lasso_manual)
Modifier et exécuter le code