kNN ipuçları ve püf noktaları I: bağışçıları ağırlıklandırma
Sıklıkla uygulanan bir kNN imputasyon varyasyonu, mesafe-ağırlıklı birleştirme (distance-weighted aggregation) kullanır. Bunun anlamı şu: Eksik bir değer için komşulardan gelen değerleri bir araya getirirken, ağırlıklı ortalama kullanırız ve ağırlıklar her bir komşunun ters mesafeleridir. Böylece, daha yakın komşular imput edilen değer üzerinde daha fazla etkiye sahip olur.
Bu egzersizde, tao verisini imput ederken mesafe-ağırlıklı birleştirmeyi uygulayacaksın. Bunun için kNN() fonksiyonuna iki ek argüman geçirmen yeterli. Hadi deneyelim!
Bu egzersiz, kursun bir parçasıdır
R'de Atamaya Dayalı Eksik Veri Doldurma
Egzersiz talimatları
VIMpaketini yükle.- Komşuları birleştirmek için mesafe-ağırlıklı ortalama kullanarak
humiditydeğişkenini kNN ile imput et;numFunveweightDistargümanlarını belirtmen gerekecek. - Sonuçları görmek için kenar grafiği (margin plot) zaten senin için yazıldı.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")