MulaiMulai sekarang secara gratis

Alur mice: mice - with - pool

Multiple imputation by chained equations (MICE) memungkinkan kita mengestimasi ketidakpastian dari imputasi dengan mengimputasi suatu himpunan data beberapa kali menggunakan imputasi berbasis model, sambil mengambil sampel dari sebaran bersyarat. Dengan cara ini, setiap himpunan data terimputasi akan sedikit berbeda. Kemudian, analisis dilakukan pada masing-masing himpunan data dan hasilnya digabungkan, menghasilkan besaran yang diminati beserta interval kepercayaan yang mencerminkan ketidakpastian imputasi.

Dalam latihan ini, Anda akan mempraktikkan alur MICE yang umum: mice() - with() - pool(). Anda akan melakukan analisis regresi pada data biopics untuk melihat jenis pekerjaan subjek, sub_type, yang terkait dengan pendapatan film tertinggi. Mari bermain dengan mice!

Latihan ini adalah bagian dari kursus

Menangani Data Hilang dengan Imputasi di R

Lihat Kursus

Petunjuk latihan

  • Muat paket mice dan imputasi biopics dengan mice() menggunakan 5 imputasi, lalu simpan hasilnya ke biopics_multiimp.
  • Sesuaikan model regresi linear yang memodelkan earnings menggunakan year dan sub_type pada setiap himpunan data terimputasi, lalu simpan hasilnya ke lm_multiimp.
  • Gabungkan model regresi yang disimpan di lm_multiimp, lalu simpan hasilnya ke lm_pooled.
  • Ringkas lm_pooled sehingga menghasilkan interval kepercayaan dengan tingkat kepercayaan 95%.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load mice package
___

# Impute biopics with mice using 5 imputations
biopics_multiimp <- ___(___, m = ___, seed = 3108)

# Fit linear regression to each imputed data set 
lm_multiimp <- ___(___, ___)

# Pool and summarize regression results
lm_pooled <- ___(___)
___(___, conf.int = ___, conf.level = ___)
Edit dan Jalankan Kode