Daten für Lasso-Regression skalieren

Um ein Lasso-Regressionmodell anzupassen, ist es wichtig, die Daten zu skalieren, damit alle Features gut miteinander vergleichbar sind. Der vollständige Datensatz der Hausverkäufe in King County, California steht in house_sales_df zur Verfügung.

In dieser Übung skalierst du die Zielvariable price separat, bevor du die Daten in Trainings- und Testdaten aufteilst. Das liegt daran, wie tidymodels-Rezepte funktionieren. Transformationen der Zielvariable nehmen wir nicht in das Rezept auf.

Die Pakete tidyverse und tidymodels wurden bereits für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

Skaliere die Zielvariable price in house_sales_df mit scale().
Erstelle Trainings- und Testdaten mit 80 % im Trainingssatz.
Erstelle das Rezept mit den Trainingsdaten, um alle numerischen Prädiktoren zu skalieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Scale the target variable
house_sales_df <-  ___ %>% 
  mutate(price = as.vector(___(___)))

# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <-  ___ %>% ___()

# Create recipe to scale the predictors
lasso_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___())

Code bearbeiten und ausführen