Hot-deck ipuçları ve püfler II: ilişkili değişkenlere göre sıralama
Hot-deck itmalenin başarımını artırabilecek bir başka püf nokta, veriyi itmal etmek istediğimiz değişkenle ilişkili değişkenlere göre sıralamaktır.
Örneğin, son zamanlarda çizdiğin tüm kenar grafikleri (margin plot) hava sıcaklığının deniz yüzeyi sıcaklığıyla güçlü biçimde ilişkili olduğunu gösteriyordu; bu da gayet mantıklı. Bu bilgiyi hot-deck itmaleni geliştirmek için kullanabilirsin. Veriyi önce sea_surface_temp'e göre sıralarsan, itmal edilen her air_temp değeri, benzer sea_surface_temp değerine sahip bir bağışçıdan (donor) gelecektir. Bunun nasıl çalışacağına bakalım!
Bu egzersiz, kursun bir parçasıdır
R'de Atamaya Dayalı Eksik Veri Doldurma
Egzersiz talimatları
taoverisindekiair_tempiçindeki eksik değerleri,sea_surface_temp'e göre sıralayarak hot-deck ile itmal et ve sonucutao_imp'e ata.air_tempilesea_surface_tempiçin bir kenar grafiği (margin plot) oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Hot-deck-impute air_temp in tao ordering by sea_surface_temp
tao_imp <- ___(___, ___ = ___, ___ = ___)
# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>%
select(air_temp, sea_surface_temp, air_temp_imp) %>%
___(___ = ___)