Lasso regresyon için veriyi ölçekle
Bir lasso regresyon modeli kurmaya hazırlanırken, tüm özelliklerin birbirleriyle karşılaştırılabilir olması için veriyi ölçeklemek önemlidir. King County, California konut satış verilerinin tamamı house_sales_df içinde mevcuttur.
Bu egzersizde, veriyi eğitim ve test kümelerine ayırmadan önce hedef değişken price'ı ayrı olarak ölçekleyeceksin. Bunun nedeni tidymodels recipe'lerinin çalışma biçimidir. Hedef değişken dönüşümlerini recipe'e dahil etmeyiz.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
R'de Boyutsal Azaltma
Egzersiz talimatları
house_sales_dfiçinde hedef değişkenprice'ıscale()kullanarak ölçekle.- Eğitim ve test kümelerini, eğitim kümesi %80 olacak şekilde oluştur.
- Tüm sayısal yordayıcıları ölçeklemek için eğitim verisini kullanarak recipe oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Scale the target variable
house_sales_df <- ___ %>%
mutate(price = as.vector(___(___)))
# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <- ___ %>% ___()
# Create recipe to scale the predictors
lasso_recipe <-
___(___ ~ ., data = ___) %>%
___(___())