BaşlayınÜcretsiz Başlayın

Sıcaklığın ortalama ile imputasyonu

Ortalama ile imputasyon riskli olabilir. Ortalama ile imputasyon yaptığın değişken diğer değişkenlerle ilişkiliyse, bu ilişki imputasyon değerleriyle bozulabilir. Bunu, önceki egzersizde air_temp değişkenini incelerken sezmiştin.

Bu endişelerin yerinde olup olmadığını görmek için, bu egzersizde air_temp üzerinde ortalama ile imputasyon yapacak ve ayrıca değerlerin nerede imputasyonla doldurulduğunu gösteren ikili bir gösterge değişkeni oluşturacaksın. Bu, bir sonraki egzersizde imputasyon performansını değerlendirirken işine yarayacak. Haydi eksik değerleri dolduralım!

Bu egzersiz

R'de Atamaya Dayalı Eksik Veri Doldurma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • taoyu değiştiren boru hattında, air_temp eksikse TRUE, değilse FALSE olan air_temp_imp adlı yeni bir değişken oluştur.
  • Aynı boru hattında daha sonra, air_temp eksik olduğunda kendi ortalamasıyla üzerine yaz, değilse olduğu gibi bırak; sonucu tao_impa ata.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

tao_imp <- tao %>% 
  # Create a binary indicator for missing values in air_temp
  ___(air_temp_imp = ifelse(___(___), ___, ___)) %>% 
  # Impute air_temp with its mean
  ___(air_temp = ifelse(___(___), ___(___, na.rm = ___), ___))

# Print the first 10 rows of tao_imp
head(tao_imp, 10)
Kodu Düzenle ve Çalıştır