1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Quy trình mice: mice - with - pool

Phương pháp thế khuyết nhiều lần theo phương trình xâu chuỗi (MICE) cho phép ước lượng mức độ bất định do thế khuyết bằng cách thế khuyết một bộ dữ liệu nhiều lần dựa trên mô hình và lấy mẫu từ các phân phối có điều kiện. Nhờ vậy, mỗi bộ dữ liệu đã thế khuyết sẽ hơi khác nhau. Sau đó, bạn sẽ phân tích trên từng bộ và gộp (pool) các kết quả lại, thu được các đại lượng quan tâm kèm theo khoảng tin cậy phản ánh bất định do thế khuyết.

Trong bài này, bạn sẽ luyện tập quy trình MICE điển hình: mice() - with() - pool(). Bạn sẽ chạy phân tích hồi quy trên dữ liệu biopics để xem nghề nghiệp của nhân vật, sub_type, nghề nào gắn với doanh thu phim cao nhất. Cùng “chơi với mice” nào!

Hướng dẫn

100 XP
  • Nạp gói mice và thế khuyết biopics bằng mice() với 5 lần thế khuyết, gán kết quả vào biopics_multiimp.
  • Khớp mô hình hồi quy tuyến tính giải thích earnings theo year và sub_type cho từng bộ dữ liệu đã thế khuyết, gán kết quả vào lm_multiimp.
  • Gộp (pool) các mô hình hồi quy đã lưu trong lm_multiimp lại với nhau, gán kết quả vào lm_pooled.
  • Tóm tắt lm_pooled sao cho tạo ra khoảng tin cậy với mức tin cậy 95%.