Imputasi regresi linear
Terkadang, Anda dapat menggunakan pengetahuan domain, penelitian sebelumnya, atau nalar sehat untuk menggambarkan hubungan antarvariabel dalam data Anda. Dalam kasus seperti ini, imputasi berbasis model adalah solusi yang sangat baik karena memungkinkan Anda melakukan imputasi pada setiap variabel sesuai model statistik yang Anda tentukan sendiri, dengan mempertimbangkan asumsi apa pun tentang bagaimana variabel saling memengaruhi.
Untuk variabel kontinu, pilihan model yang populer adalah regresi linear. Namun, ini tidak membatasi Anda hanya pada hubungan linear! Anda selalu dapat menyertakan kuadrat atau logaritma dari suatu variabel sebagai prediktor. Dalam latihan ini, Anda akan menggunakan paket simputation untuk menjalankan satu kali imputasi regresi linear pada data tao dan menganalisis hasilnya. Mari kita coba!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the simputation package
___
# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)