kNN ipuçları ve püf noktaları I: bağışçıları ağırlıklandırma
Sıklıkla uygulanan bir kNN imputasyon varyasyonu, mesafe-ağırlıklı birleştirme (distance-weighted aggregation) kullanır. Bunun anlamı şu: Eksik bir değer için komşulardan gelen değerleri bir araya getirirken, ağırlıklı ortalama kullanırız ve ağırlıklar her bir komşunun ters mesafeleridir. Böylece, daha yakın komşular imput edilen değer üzerinde daha fazla etkiye sahip olur.
Bu egzersizde, tao verisini imput ederken mesafe-ağırlıklı birleştirmeyi uygulayacaksın. Bunun için kNN() fonksiyonuna iki ek argüman geçirmen yeterli. Hadi deneyelim!
Bu egzersiz
R'de Atamaya Dayalı Eksik Veri Doldurma
kursunun bir parçasıdırEgzersiz talimatları
VIMpaketini yükle.- Komşuları birleştirmek için mesafe-ağırlıklı ortalama kullanarak
humiditydeğişkenini kNN ile imput et;numFunveweightDistargümanlarını belirtmen gerekecek. - Sonuçları görmek için kenar grafiği (margin plot) zaten senin için yazıldı.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")