Trik & kiat kNN I: pembobotan donor
Salah satu variasi imputasi kNN yang sering digunakan adalah agregasi berbobot jarak. Artinya, saat kita mengagregasikan nilai dari para tetangga untuk mendapatkan pengganti nilai yang hilang, kita menggunakan mean berbobot dan bobotnya adalah kebalikan dari jarak setiap tetangga. Akibatnya, tetangga yang lebih dekat memiliki pengaruh lebih besar pada nilai imputasi.
Dalam latihan ini, Anda akan menerapkan agregasi berbobot jarak saat melakukan imputasi pada data tao. Ini hanya memerlukan pemberian dua argumen tambahan ke fungsi kNN(). Mari kita coba!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Petunjuk latihan
- Muat paket
VIM. - Imputasi
humiditydengan kNN menggunakan mean berbobot jarak untuk mengagregasikan tetangga; Anda perlu menentukan argumennumFundanweightDist. - Plot margin untuk melihat hasilnya sudah disiapkan untuk Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")