ComeçarComece de graça

Ajuste o hiperparâmetro penalty

Agora que você viu como o parâmetro penalty afeta a seleção de variáveis da regressão lasso, pode estar se perguntando: "Qual é o melhor valor para penalty?" O tidymodels fornece funções para explorar o melhor valor de hiperparâmetros como penalty.

Neste exercício, você vai encontrar o melhor valor de penalty com base no RMSE do modelo e, em seguida, ajustar um modelo final com esse valor de penalty. Isso vai otimizar a seleção de variáveis da regressão lasso para o desempenho do modelo.

O lasso_recipe já foi criado para você e o train também está disponível. Os pacotes tidyverse e tidymodels também foram carregados para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

  • Defina um workflow de linear_reg() que fará o tuning de penalty.
  • Crie uma amostra de validação cruzada com 3 dobras a partir de train e uma sequência de 20 valores de penalty variando de 0,001 a 0,1.
  • Crie modelos lasso usando diferentes valores de penalty.
  • Visualize o desempenho do modelo (RMSE) em função do valor de penalty.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)

# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)

# Create lasso models with different penalty values
lasso_grid <- tune_grid(
  ___,
  resamples = ___,
  grid = ___)

# Plot RMSE vs. penalty values
___(___, metric = "rmse")
Editar e executar o código