BaşlayınÜcretsiz başlayın

Kayıp değer oranı filtresi oluştur

house_sales_df veri çerçevesi, bir hedef değişken olan price ve tek tek evleri tanımlayan ve satış fiyatlarını belirleyen çeşitli yordayıcılar içerir. Bazı özelliklerde farklı sayılarda kayıp değerler vardır. Kayıp değer oranı çok yüksekse, bu özellik evin fiyatını tahmin etmede çok bilgilendirici olmayacaktır. Bu özellikler kaldırılabilir. Bu egzersizde, her sütun için kayıp değer oranını hesaplayacaksın. Bu, her sütun için uygun bir eşik hakkında düşünmene yardımcı olacak.

tidyverse paketi senin için yüklendi.

Bu egzersiz, kursun bir parçasıdır

R'de Boyutsal Azaltma

Kursa Göz Atın

Egzersiz talimatları

  • house_sales_df içindeki toplam satır sayısını n içine kaydet.
  • house_sales_df içindeki her sütun için kayıp değer oranlarını hesapla ve missing_vals_df içine kaydet.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Kodu Düzenle ve Çalıştır