Stem de hyperparameter penalty af

Nu je hebt gezien hoe de parameter penalty de featureselectie van lasso-regressie beïnvloedt, vraag je je misschien af: "Wat is de beste waarde voor penalty?" tidymodels biedt functies om de beste waarde voor hyperparameters zoals penalty te verkennen.

In deze oefening zoek je de beste waarde voor penalty op basis van de RMSE van het model en pas je vervolgens een definitief model met die penalty-waarde. Dit optimaliseert de featureselectie van lasso-regressie voor de modelprestatie.

lasso_recipe is voor je klaargezet en train is ook beschikbaar. De pakketten tidyverse en tidymodels zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Bekijk cursus

Oefeninstructies

Definieer een linear_reg()-workflow die penalty zal tunen.
Maak een 3-voudige crossvalidatiesteekproef van train en een reeks van 20 penalty-waarden van 0,001 tot 0,1.
Maak lasso-modellen met verschillende penalty-waarden.
Visualiseer de modelprestatie (RMSE) op basis van de penalty-waarde.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)

# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)

# Create lasso models with different penalty values
lasso_grid <- tune_grid(
  ___,
  resamples = ___,
  grid = ___)

# Plot RMSE vs. penalty values
___(___, metric = "rmse")

Code bewerken en uitvoeren