Mencium bahaya imputasi rata-rata
Salah satu metode imputasi yang paling populer adalah imputasi rata-rata, yaitu nilai hilang pada suatu variabel diganti dengan nilai rata-rata dari nilai yang teramati pada variabel tersebut. Namun, dalam banyak kasus, pendekatan sederhana ini bukan pilihan yang baik. Terkadang, sekilas melihat data saja sudah dapat memperingatkan Anda tentang bahaya melakukan imputasi rata-rata.
Pada bab ini, Anda akan bekerja dengan sub-sampel data proyek Tropical Atmosphere Ocean (tao). Himpunan data ini berisi pengukuran atmosfer yang diambil pada dua periode waktu yang berbeda di lima lokasi berbeda. Data ini tersedia dalam paket VIM.
Pada latihan ini, Anda akan membiasakan diri dengan data dan melakukan analisis sederhana yang akan menunjukkan apa konsekuensi dari imputasi rata-rata. Mari kita lihat data tao!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print first 10 observations
___(tao, ___)