Den Hyperparameter penalty abstimmen

Nachdem du gesehen hast, wie der Parameter penalty die Feature-Auswahl der Lasso-Regression beeinflusst, fragst du dich vielleicht: „Welcher Wert für penalty ist der beste?“ tidymodels stellt Funktionen bereit, um die besten Werte für Hyperparameter wie penalty zu erkunden.

In dieser Übung findest du den besten penalty-Wert auf Basis des RMSE des Modells und passt anschließend ein finales Modell mit diesem penalty-Wert an. Damit optimierst du die Feature-Auswahl der Lasso-Regression für die Modellleistung.

lasso_recipe wurde für dich erstellt und train ist ebenfalls verfügbar. Die Pakete tidyverse und tidymodels sind bereits geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

Definiere einen linear_reg()-Workflow, bei dem penalty abgestimmt wird.
Erstelle aus train ein 3-fach-Cross-Validation-Sample und eine Folge von 20 penalty-Werten im Bereich von 0,001 bis 0,1.
Erzeuge Lasso-Modelle mit unterschiedlichen penalty-Werten.
Stelle die Modellleistung (RMSE) in Abhängigkeit vom penalty-Wert grafisch dar.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create tune-able model
lasso_model <- ___(___ = ___(), mixture = ___, engine = "glmnet")
lasso_workflow <- workflow(preprocessor = lasso_recipe, ___ = ___)

# Create a cross validation sample and sequence of penalty values
train_cv <- ___(___, v = ___)
penalty_grid <- grid_regular(penalty(range = c(___, ___)), levels = ___)

# Create lasso models with different penalty values
lasso_grid <- tune_grid(
  ___,
  resamples = ___,
  grid = ___)

# Plot RMSE vs. penalty values
___(___, metric = "rmse")

Code bearbeiten und ausführen