Menggunakan matriks prediktor
Keputusan penting saat menggunakan imputasi berbasis model adalah menentukan variabel mana yang harus disertakan sebagai prediktor, dan dalam model yang mana. Dalam mice(), hal ini diatur oleh matriks prediktor dan, secara bawaan, semua variabel digunakan untuk mengimputasi variabel lainnya.
Jika terdapat banyak variabel dalam data atau waktu Anda terbatas untuk melakukan pemilihan model yang tepat, Anda dapat menggunakan fungsionalitas mice untuk membuat matriks prediktor berdasarkan korelasi antarkomponen variabel. Matriks ini kemudian dapat diberikan ke mice(). Pada latihan ini, Anda akan mempraktikkan hal tersebut: pertama, Anda akan membangun matriks prediktor sehingga setiap variabel akan diimputasi menggunakan variabel yang paling berkorelasi dengannya; lalu, Anda akan memberikan matriks prediktor tersebut ke fungsi imputasi. Mari coba pemilihan model sederhana ini!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)