Düşük varyanslı bir tarif oluştur
tidymodels paketleri, sırasıyla step_zv() ve step_nzv() fonksiyonlarıyla sıfır ve sıfıra yakın varyansa sahip özellikleri filtrelemek için daha iyi bir yol sunar. Bu tarif adımları, her bir özelliğin benzersiz değer sayısını ve en yaygın değerlerin frekans oranını inceleyerek düşük varyanslı özellikleri belirler. Bu yaklaşım, daha önce kullandığımız basit varyans eşik değerinden daha sağlamdır.
Ayrıca, özelliklerin varyansını normalize etmek için step_scale() tarif adımını kullanacaksın. Unutma, özellikler arasındaki varyansları karşılaştırılabilir kılmak için verileri normalize etmek her zaman iyi bir fikirdir.
house_sales_df kullanman için hazır. Hedef değişken price. tidyverse ve tidymodels paketleri de senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- Düşük varyans filtresi için bir tarif tanımla ve
house_sales_dfkullanarak hazırla. - Tarifi
house_sales_dfüzerine uygula ve filtrelenmiş veriyifiltered_house_sales_dfiçinde sakla. - Tarifin
step_nzv()adımında filtrelediği özellikleri görüntüle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Prepare recipe
low_variance_recipe <- recipe(___ ~ ___, ___ = ___) %>%
step_zv(___) %>%
___(___) %>%
___(___) %>%
prep()
# Apply recipe
filtered_house_sales_df <- ___(___, new_data = ___)
# View list of features removed by the near-zero variance step
tidy(___, number = ___)