BaşlayınÜcretsiz Başlayın

kNN ipuçları ve püf noktaları I: bağışçıları ağırlıklandırma

Sıklıkla uygulanan bir kNN imputasyon varyasyonu, mesafe-ağırlıklı birleştirme (distance-weighted aggregation) kullanır. Bunun anlamı şu: Eksik bir değer için komşulardan gelen değerleri bir araya getirirken, ağırlıklı ortalama kullanırız ve ağırlıklar her bir komşunun ters mesafeleridir. Böylece, daha yakın komşular imput edilen değer üzerinde daha fazla etkiye sahip olur.

Bu egzersizde, tao verisini imput ederken mesafe-ağırlıklı birleştirmeyi uygulayacaksın. Bunun için kNN() fonksiyonuna iki ek argüman geçirmen yeterli. Hadi deneyelim!

Bu egzersiz

R'de Atamaya Dayalı Eksik Veri Doldurma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • VIM paketini yükle.
  • Komşuları birleştirmek için mesafe-ağırlıklı ortalama kullanarak humidity değişkenini kNN ile imput et; numFun ve weightDist argümanlarını belirtmen gerekecek.
  • Sonuçları görmek için kenar grafiği (margin plot) zaten senin için yazıldı.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load the VIM package
___(___)

# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao, 
               k = 5, 
               variable = "humidity", 
               ___ = ___,
               ___ = ___)

tao_imp %>% 
	select(sea_surface_temp, humidity, humidity_imp) %>% 
	marginplot(delimiter = "imp")
Kodu Düzenle ve Çalıştır