BaşlayınÜcretsiz Başlayın

Kayıp değer oranı filtresi oluştur

house_sales_df veri çerçevesi, bir hedef değişken olan price ve tek tek evleri tanımlayan ve satış fiyatlarını belirleyen çeşitli yordayıcılar içerir. Bazı özelliklerde farklı sayılarda kayıp değerler vardır. Kayıp değer oranı çok yüksekse, bu özellik evin fiyatını tahmin etmede çok bilgilendirici olmayacaktır. Bu özellikler kaldırılabilir. Bu egzersizde, her sütun için kayıp değer oranını hesaplayacaksın. Bu, her sütun için uygun bir eşik hakkında düşünmene yardımcı olacak.

tidyverse paketi senin için yüklendi.

Bu egzersiz

R'de Boyutsal Azaltma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • house_sales_df içindeki toplam satır sayısını n içine kaydet.
  • house_sales_df içindeki her sütun için kayıp değer oranlarını hesapla ve missing_vals_df içine kaydet.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Kodu Düzenle ve Çalıştır