BaşlayınÜcretsiz başlayın

Hot-deck ipuçları ve püfler II: ilişkili değişkenlere göre sıralama

Hot-deck itmalenin başarımını artırabilecek bir başka püf nokta, veriyi itmal etmek istediğimiz değişkenle ilişkili değişkenlere göre sıralamaktır.

Örneğin, son zamanlarda çizdiğin tüm kenar grafikleri (margin plot) hava sıcaklığının deniz yüzeyi sıcaklığıyla güçlü biçimde ilişkili olduğunu gösteriyordu; bu da gayet mantıklı. Bu bilgiyi hot-deck itmaleni geliştirmek için kullanabilirsin. Veriyi önce sea_surface_temp'e göre sıralarsan, itmal edilen her air_temp değeri, benzer sea_surface_temp değerine sahip bir bağışçıdan (donor) gelecektir. Bunun nasıl çalışacağına bakalım!

Bu egzersiz, kursun bir parçasıdır

R'de Atamaya Dayalı Eksik Veri Doldurma

Kursa Göz Atın

Egzersiz talimatları

  • tao verisindeki air_temp içindeki eksik değerleri, sea_surface_temp'e göre sıralayarak hot-deck ile itmal et ve sonucu tao_imp'e ata.
  • air_temp ile sea_surface_temp için bir kenar grafiği (margin plot) oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Hot-deck-impute air_temp in tao ordering by sea_surface_temp
tao_imp <- ___(___, ___ = ___, ___ = ___)

# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>% 
	select(air_temp, sea_surface_temp, air_temp_imp) %>% 
	___(___ = ___)
Kodu Düzenle ve Çalıştır