Menggunakan matriks prediktor
Keputusan penting saat menggunakan imputasi berbasis model adalah menentukan variabel mana yang harus disertakan sebagai prediktor, dan dalam model yang mana. Dalam mice(), hal ini diatur oleh matriks prediktor dan, secara bawaan, semua variabel digunakan untuk mengimputasi variabel lainnya.
Jika terdapat banyak variabel dalam data atau waktu Anda terbatas untuk melakukan pemilihan model yang tepat, Anda dapat menggunakan fungsionalitas mice untuk membuat matriks prediktor berdasarkan korelasi antarkomponen variabel. Matriks ini kemudian dapat diberikan ke mice(). Pada latihan ini, Anda akan mempraktikkan hal tersebut: pertama, Anda akan membangun matriks prediktor sehingga setiap variabel akan diimputasi menggunakan variabel yang paling berkorelasi dengannya; lalu, Anda akan memberikan matriks prediktor tersebut ke fungsi imputasi. Mari coba pemilihan model sederhana ini!
Latihan ini merupakan bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)