Hot-deck ipuçları ve püfler II: ilişkili değişkenlere göre sıralama
Hot-deck itmalenin başarımını artırabilecek bir başka püf nokta, veriyi itmal etmek istediğimiz değişkenle ilişkili değişkenlere göre sıralamaktır.
Örneğin, son zamanlarda çizdiğin tüm kenar grafikleri (margin plot) hava sıcaklığının deniz yüzeyi sıcaklığıyla güçlü biçimde ilişkili olduğunu gösteriyordu; bu da gayet mantıklı. Bu bilgiyi hot-deck itmaleni geliştirmek için kullanabilirsin. Veriyi önce sea_surface_temp'e göre sıralarsan, itmal edilen her air_temp değeri, benzer sea_surface_temp değerine sahip bir bağışçıdan (donor) gelecektir. Bunun nasıl çalışacağına bakalım!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırEgzersiz talimatları
taoverisindekiair_tempiçindeki eksik değerleri,sea_surface_temp'e göre sıralayarak hot-deck ile itmal et ve sonucutao_imp'e ata.air_tempilesea_surface_tempiçin bir kenar grafiği (margin plot) oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Hot-deck-impute air_temp in tao ordering by sea_surface_temp
tao_imp <- ___(___, ___ = ___, ___ = ___)
# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>%
select(air_temp, sea_surface_temp, air_temp_imp) %>%
___(___ = ___)