Den Hyperparameter penalty abstimmen
Nachdem du gesehen hast, wie der Parameter penalty die Feature-Auswahl der Lasso-Regression beeinflusst, fragst du dich vielleicht: „Welcher Wert für penalty ist der beste?“ tidymodels stellt Funktionen bereit, um die besten Werte für Hyperparameter wie penalty zu erkunden.
In dieser Übung findest du den besten penalty-Wert auf Basis des RMSE des Modells und passt anschließend ein finales Modell mit diesem penalty-Wert an. Damit optimierst du die Feature-Auswahl der Lasso-Regression für die Modellleistung.
lasso_recipe wurde für dich erstellt und train ist ebenfalls verfügbar. Die Pakete tidyverse und tidymodels sind bereits geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Definiere einen
linear_reg()-Workflow, bei dempenaltyabgestimmt wird. - Erstelle aus
trainein 3-fach-Cross-Validation-Sample und eine Folge von 20 penalty-Werten im Bereich von 0,001 bis 0,1. - Erzeuge Lasso-Modelle mit unterschiedlichen penalty-Werten.
- Stelle die Modellleistung (RMSE) in Abhängigkeit vom penalty-Wert grafisch dar.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)
# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)
# Create lasso models with different penalty values
lasso_grid <- tune_grid(
___,
resamples = ___,
grid = ___)
# Plot RMSE vs. penalty values
___(___, metric = "rmse")