Daten für Lasso-Regression skalieren
Um ein Lasso-Regressionmodell anzupassen, ist es wichtig, die Daten zu skalieren, damit alle Features gut miteinander vergleichbar sind. Der vollständige Datensatz der Hausverkäufe in King County, California steht in house_sales_df zur Verfügung.
In dieser Übung skalierst du die Zielvariable price separat, bevor du die Daten in Trainings- und Testdaten aufteilst. Das liegt daran, wie tidymodels-Rezepte funktionieren. Transformationen der Zielvariable nehmen wir nicht in das Rezept auf.
Die Pakete tidyverse und tidymodels wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Skaliere die Zielvariable
priceinhouse_sales_dfmitscale(). - Erstelle Trainings- und Testdaten mit 80 % im Trainingssatz.
- Erstelle das Rezept mit den Trainingsdaten, um alle numerischen Prädiktoren zu skalieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Scale the target variable
house_sales_df <- ___ %>%
mutate(price = as.vector(___(___)))
# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <- ___ %>% ___()
# Create recipe to scale the predictors
lasso_recipe <-
___(___ ~ ., data = ___) %>%
___(___())