Ajusta el hiperparámetro penalty
Ahora que has visto cómo el parámetro penalty influye en la selección de variables de la regresión lasso, quizá te preguntes: «¿Cuál es el mejor valor para penalty?» tidymodels ofrece funciones para explorar el mejor valor de hiperparámetros como penalty.
En este ejercicio, encontrarás el mejor valor de penalty según el RMSE del modelo y, después, ajustarás un modelo final con ese valor de penalty. Esto optimizará la selección de variables de la regresión lasso para el rendimiento del modelo.
lasso_recipe ya se ha creado para ti y train también está disponible. Los paquetes tidyverse y tidymodels también se han cargado por ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Define un workflow de
linear_reg()que permita ajustarpenalty. - Crea una validación cruzada de 3 particiones a partir de
trainy una secuencia de 20 valores depenaltyentre 0.001 y 0.1. - Crea modelos lasso usando distintos valores de
penalty. - Representa el rendimiento del modelo (RMSE) en función del valor de
penalty.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)
# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)
# Create lasso models with different penalty values
lasso_grid <- tune_grid(
___,
resamples = ___,
grid = ___)
# Plot RMSE vs. penalty values
___(___, metric = "rmse")