Lasso regresyon için veriyi ölçekle
Bir lasso regresyon modeli kurmaya hazırlanırken, tüm özelliklerin birbirleriyle karşılaştırılabilir olması için veriyi ölçeklemek önemlidir. King County, California konut satış verilerinin tamamı house_sales_df içinde mevcuttur.
Bu egzersizde, veriyi eğitim ve test kümelerine ayırmadan önce hedef değişken price'ı ayrı olarak ölçekleyeceksin. Bunun nedeni tidymodels recipe'lerinin çalışma biçimidir. Hedef değişken dönüşümlerini recipe'e dahil etmeyiz.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
house_sales_dfiçinde hedef değişkenprice'ıscale()kullanarak ölçekle.- Eğitim ve test kümelerini, eğitim kümesi %80 olacak şekilde oluştur.
- Tüm sayısal yordayıcıları ölçeklemek için eğitim verisini kullanarak recipe oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Scale the target variable
house_sales_df <- ___ %>%
mutate(price = as.vector(___(___)))
# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <- ___ %>% ___()
# Create recipe to scale the predictors
lasso_recipe <-
___(___ ~ ., data = ___) %>%
___(___())