Mencium bahaya imputasi rata-rata
Salah satu metode imputasi yang paling populer adalah imputasi rata-rata, yaitu nilai hilang pada suatu variabel diganti dengan nilai rata-rata dari nilai yang teramati pada variabel tersebut. Namun, dalam banyak kasus, pendekatan sederhana ini bukan pilihan yang baik. Terkadang, sekilas melihat data saja sudah dapat memperingatkan Anda tentang bahaya melakukan imputasi rata-rata.
Pada bab ini, Anda akan bekerja dengan sub-sampel data proyek Tropical Atmosphere Ocean (tao). Himpunan data ini berisi pengukuran atmosfer yang diambil pada dua periode waktu yang berbeda di lima lokasi berbeda. Data ini tersedia dalam paket VIM.
Pada latihan ini, Anda akan membiasakan diri dengan data dan melakukan analisis sederhana yang akan menunjukkan apa konsekuensi dari imputasi rata-rata. Mari kita lihat data tao!
Latihan ini merupakan bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Print first 10 observations
___(tao, ___)