Marjin grafiği ile imputasyon kalitesini değerlendirme
Son egzersizde air_temp için ortalama imputasyonu yaptın ve hangi değerlerin imputasyon olduğunu belirtmek için air_temp_imp adlı bir gösterge değişkeni ekledin. Şimdi bunun ne kadar iyi çalıştığını görelim.
tao verilerini incelerken, makul şekilde air_temp ile pozitif korelasyon göstermesi beklenen sea_surface_temp adlı bir değişken daha olduğunu fark etmiş olabilirsin. Eğer öyleyse, bu iki sıcaklığın aynı anda hem yüksek hem de düşük olmasını beklersin. Deniz sıcaklığı çok yüksek ya da çok düşükken hava sıcaklığına ortalama değer atamak bu ilişkiyi bozar.
Bunu görmek için, bu egzersizde iki sıcaklık değişkenini ve gösterge değişkenini seçecek ve bunları kullanarak bir marjin grafiği çizeceksin. Ortalama imputasyonu birlikte değerlendirelim!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Draw a margin plot of air_temp vs sea_surface_temp
tao_imp %>%
select(___, ___, ___) %>%
___(delimiter = ___)