Düşük varyanslı bir tarif oluştur

tidymodels paketleri, sırasıyla step_zv() ve step_nzv() fonksiyonlarıyla sıfır ve sıfıra yakın varyansa sahip özellikleri filtrelemek için daha iyi bir yol sunar. Bu tarif adımları, her bir özelliğin benzersiz değer sayısını ve en yaygın değerlerin frekans oranını inceleyerek düşük varyanslı özellikleri belirler. Bu yaklaşım, daha önce kullandığımız basit varyans eşik değerinden daha sağlamdır.

Ayrıca, özelliklerin varyansını normalize etmek için step_scale() tarif adımını kullanacaksın. Unutma, özellikler arasındaki varyansları karşılaştırılabilir kılmak için verileri normalize etmek her zaman iyi bir fikirdir.

house_sales_df kullanman için hazır. Hedef değişken price. tidyverse ve tidymodels paketleri de senin için yüklendi.

Bu egzersiz, kursun bir parçasıdır

R'de Boyutsal Azaltma

Kursa Göz Atın

Egzersiz talimatları

Düşük varyans filtresi için bir tarif tanımla ve house_sales_df kullanarak hazırla.
Tarifi house_sales_df üzerine uygula ve filtrelenmiş veriyi filtered_house_sales_df içinde sakla.
Tarifin step_nzv() adımında filtrelediği özellikleri görüntüle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Prepare recipe
low_variance_recipe <- recipe(___ ~ ___, ___ = ___) %>% 
  step_zv(___) %>% 
  ___(___) %>% 
  ___(___) %>% 
  prep()

# Apply recipe
filtered_house_sales_df <- ___(___, new_data = ___)

# View list of features removed by the near-zero variance step 
tidy(___, number = ___)

Kodu Düzenle ve Çalıştır