Sıcaklığın ortalama ile imputasyonu
Ortalama ile imputasyon riskli olabilir. Ortalama ile imputasyon yaptığın değişken diğer değişkenlerle ilişkiliyse, bu ilişki imputasyon değerleriyle bozulabilir. Bunu, önceki egzersizde air_temp değişkenini incelerken sezmiştin.
Bu endişelerin yerinde olup olmadığını görmek için, bu egzersizde air_temp üzerinde ortalama ile imputasyon yapacak ve ayrıca değerlerin nerede imputasyonla doldurulduğunu gösteren ikili bir gösterge değişkeni oluşturacaksın. Bu, bir sonraki egzersizde imputasyon performansını değerlendirirken işine yarayacak. Haydi eksik değerleri dolduralım!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırEgzersiz talimatları
taoyu değiştiren boru hattında,air_tempeksikseTRUE, değilseFALSEolanair_temp_impadlı yeni bir değişken oluştur.- Aynı boru hattında daha sonra,
air_tempeksik olduğunda kendi ortalamasıyla üzerine yaz, değilse olduğu gibi bırak; sonucutao_impa ata.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
tao_imp <- tao %>%
# Create a binary indicator for missing values in air_temp
___(air_temp_imp = ifelse(___(___), ___, ___)) %>%
# Impute air_temp with its mean
___(air_temp = ifelse(___(___), ___(___, na.rm = ___), ___))
# Print the first 10 rows of tao_imp
head(tao_imp, 10)