Kayıp değer oranı filtresi oluştur
house_sales_df veri çerçevesi, bir hedef değişken olan price ve tek tek evleri tanımlayan ve satış fiyatlarını belirleyen çeşitli yordayıcılar içerir. Bazı özelliklerde farklı sayılarda kayıp değerler vardır. Kayıp değer oranı çok yüksekse, bu özellik evin fiyatını tahmin etmede çok bilgilendirici olmayacaktır. Bu özellikler kaldırılabilir. Bu egzersizde, her sütun için kayıp değer oranını hesaplayacaksın. Bu, her sütun için uygun bir eşik hakkında düşünmene yardımcı olacak.
tidyverse paketi senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
R'de Boyutsal Azaltma
Egzersiz talimatları
house_sales_dfiçindeki toplam satır sayısınıniçine kaydet.house_sales_dfiçindeki her sütun için kayıp değer oranlarını hesapla vemissing_vals_dfiçine kaydet.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df