Ajuste o hiperparâmetro penalty
Agora que você viu como o parâmetro penalty afeta a seleção de variáveis da regressão lasso, pode estar se perguntando: "Qual é o melhor valor para penalty?" O tidymodels fornece funções para explorar o melhor valor de hiperparâmetros como penalty.
Neste exercício, você vai encontrar o melhor valor de penalty com base no RMSE do modelo e, em seguida, ajustar um modelo final com esse valor de penalty. Isso vai otimizar a seleção de variáveis da regressão lasso para o desempenho do modelo.
O lasso_recipe já foi criado para você e o train também está disponível. Os pacotes tidyverse e tidymodels também foram carregados para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Defina um workflow de
linear_reg()que fará o tuning depenalty. - Crie uma amostra de validação cruzada com 3 dobras a partir de
traine uma sequência de 20 valores de penalty variando de 0,001 a 0,1. - Crie modelos lasso usando diferentes valores de penalty.
- Visualize o desempenho do modelo (RMSE) em função do valor de penalty.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)
# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)
# Create lasso models with different penalty values
lasso_grid <- tune_grid(
___,
resamples = ___,
grid = ___)
# Plot RMSE vs. penalty values
___(___, metric = "rmse")