BaşlayınÜcretsiz başlayın

Lasso regresyon için veriyi ölçekle

Bir lasso regresyon modeli kurmaya hazırlanırken, tüm özelliklerin birbirleriyle karşılaştırılabilir olması için veriyi ölçeklemek önemlidir. King County, California konut satış verilerinin tamamı house_sales_df içinde mevcuttur.

Bu egzersizde, veriyi eğitim ve test kümelerine ayırmadan önce hedef değişken price'ı ayrı olarak ölçekleyeceksin. Bunun nedeni tidymodels recipe'lerinin çalışma biçimidir. Hedef değişken dönüşümlerini recipe'e dahil etmeyiz.

tidyverse ve tidymodels paketleri senin için yüklendi.

Bu egzersiz, kursun bir parçasıdır

R'de Boyutsal Azaltma

Kursa Göz Atın

Egzersiz talimatları

  • house_sales_df içinde hedef değişken pricescale() kullanarak ölçekle.
  • Eğitim ve test kümelerini, eğitim kümesi %80 olacak şekilde oluştur.
  • Tüm sayısal yordayıcıları ölçeklemek için eğitim verisini kullanarak recipe oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Scale the target variable
house_sales_df <-  ___ %>% 
  mutate(price = as.vector(___(___)))

# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <-  ___ %>% ___()

# Create recipe to scale the predictors
lasso_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___()) 
Kodu Düzenle ve Çalıştır