Kayıp değer oranı filtresi oluştur
house_sales_df veri çerçevesi, bir hedef değişken olan price ve tek tek evleri tanımlayan ve satış fiyatlarını belirleyen çeşitli yordayıcılar içerir. Bazı özelliklerde farklı sayılarda kayıp değerler vardır. Kayıp değer oranı çok yüksekse, bu özellik evin fiyatını tahmin etmede çok bilgilendirici olmayacaktır. Bu özellikler kaldırılabilir. Bu egzersizde, her sütun için kayıp değer oranını hesaplayacaksın. Bu, her sütun için uygun bir eşik hakkında düşünmene yardımcı olacak.
tidyverse paketi senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
house_sales_dfiçindeki toplam satır sayısınıniçine kaydet.house_sales_dfiçindeki her sütun için kayıp değer oranlarını hesapla vemissing_vals_dfiçine kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df