Alur mice: mice - with - pool
Multiple imputation by chained equations (MICE) memungkinkan kita mengestimasi ketidakpastian dari imputasi dengan mengimputasi suatu himpunan data beberapa kali menggunakan imputasi berbasis model, sambil mengambil sampel dari sebaran bersyarat. Dengan cara ini, setiap himpunan data terimputasi akan sedikit berbeda. Kemudian, analisis dilakukan pada masing-masing himpunan data dan hasilnya digabungkan, menghasilkan besaran yang diminati beserta interval kepercayaan yang mencerminkan ketidakpastian imputasi.
Dalam latihan ini, Anda akan mempraktikkan alur MICE yang umum: mice() - with() - pool(). Anda akan melakukan analisis regresi pada data biopics untuk melihat jenis pekerjaan subjek, sub_type, yang terkait dengan pendapatan film tertinggi. Mari bermain dengan mice!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Petunjuk latihan
- Muat paket
micedan imputasibiopicsdenganmice()menggunakan 5 imputasi, lalu simpan hasilnya kebiopics_multiimp. - Sesuaikan model regresi linear yang memodelkan
earningsmenggunakanyeardansub_typepada setiap himpunan data terimputasi, lalu simpan hasilnya kelm_multiimp. - Gabungkan model regresi yang disimpan di
lm_multiimp, lalu simpan hasilnya kelm_pooled. - Ringkas
lm_pooledsehingga menghasilkan interval kepercayaan dengan tingkat kepercayaan 95%.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load mice package
___
# Impute biopics with mice using 5 imputations
biopics_multiimp <- ___(___, m = ___, seed = 3108)
# Fit linear regression to each imputed data set
lm_multiimp <- ___(___, ___)
# Pool and summarize regression results
lm_pooled <- ___(___)
___(___, conf.int = ___, conf.level = ___)