Explorer les valeurs de pénalité de la régression lasso
Dans l’exercice précédent, vous avez terminé tout le code pour mettre à l’échelle la variable cible et les variables prédictives. Vous allez utiliser les données train et lasso_recipe pour créer un workflow, entraîner un modèle de régression lasso et explorer l’effet de différentes valeurs de pénalité. À mesure que vous ajustez la pénalité et réentraînez le modèle, surveillez le nombre de variables non nulles qui restent dans le modèle. Vous observerez ainsi comment la régression lasso réalise la sélection de variables.
Les packages tidyverse et tidymodels ont été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Entraînez un workflow de régression lasso avec une pénalité de 0,001 et affichez les coefficients du modèle qui sont supérieurs à zéro.
- Réentraînez un workflow de régression lasso avec une pénalité de 0,01 et affichez les coefficients du modèle qui sont supérieurs à zéro.
- Réentraînez un workflow de régression lasso avec une pénalité de 0,1 et affichez les coefficients du modèle qui sont supérieurs à zéro.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Train workflow model with penalty = 0.001 and view model variables
lasso_model <- linear_reg(___ = ___, mixture = 1, engine = "___")
lasso_workflow <- workflow(preprocessor = lasso_recipe, spec = ___)
tidy(lasso_workflow %>% fit(train)) %>% filter(___ > ___)
# Train the workflow model with penalty = 0.01 and view model variables
lasso_model <- ___(___ = ___, ___ = ___, ___ = "___")
lasso_workflow <- workflow(preprocessor = ___, spec = ___)
tidy(lasso_workflow %>% fit(train)) %>% filter(___ > ___)
# Train the workflow model with penalty = 0.1 and view model variables
lasso_model <- ___(___ = ___, ___ = ___, ___ = "___")
lasso_workflow <- ___ %>% ___(___)
tidy(___ %>% ___(___)) %>% ___(___ > ___)