1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Sử dụng ma trận biến dự báo (predictor matrix)

Một quyết định quan trọng khi dùng phép bù (imputation) dựa trên mô hình là chọn biến nào làm biến dự báo, và dùng trong mô hình nào. Trong mice(), điều này được điều khiển bởi predictor matrix và theo mặc định, tất cả biến đều được dùng để bù cho các biến khác.

Khi dữ liệu có rất nhiều biến hoặc bạn không có nhiều thời gian để chọn mô hình bài bản, bạn có thể dùng chức năng của mice để tạo predictor matrix dựa trên tương quan giữa các biến. Ma trận này sau đó sẽ được truyền vào mice(). Trong bài tập này, bạn sẽ thực hành đúng quy trình đó: trước tiên, bạn sẽ xây dựng một predictor matrix sao cho mỗi biến được bù dựa trên các biến tương quan mạnh nhất với nó; sau đó, bạn sẽ đưa predictor matrix này vào hàm bù. Hãy thử cách chọn mô hình đơn giản này!

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tạo một predictor matrix chọn các biến dự báo có tương quan với biến đích ít nhất 0.1, gán kết quả vào pred_mat.