Ajuster l’hyperparamètre penalty
À présent que vous avez vu comment le paramètre penalty influe sur la sélection de variables par la régression lasso, vous vous demandez peut‑être : « Quelle est la meilleure valeur pour penalty ? » tidymodels fournit des fonctions pour explorer la meilleure valeur d’hyperparamètres comme penalty.
Dans cet exercice, vous allez déterminer la meilleure valeur de penalty en fonction de la RMSE du modèle, puis ajuster un modèle final avec cette valeur de penalty. Cela optimisera la sélection de variables par la régression lasso pour de meilleures performances du modèle.
lasso_recipe a été créé pour vous et train est également disponible. Les packages tidyverse et tidymodels ont aussi été chargés pour vous.
Cet exercice fait partie du cours
Réduction de dimension en R
Instructions
- Définissez un workflow
linear_reg()qui permettra d’ajusterpenalty. - Créez un échantillonnage en validation croisée à 3 plis à partir de
trainet une séquence de 20 valeurs de pénalité comprises entre 0,001 et 0,1. - Créez des modèles lasso avec différentes valeurs de pénalité.
- Tracez les performances du modèle (RMSE) en fonction de la valeur de pénalité.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)
# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)
# Create lasso models with different penalty values
lasso_grid <- tune_grid(
___,
resamples = ___,
grid = ___)
# Plot RMSE vs. penalty values
___(___, metric = "rmse")