1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Lỗi nội suy theo biến

Trong bài tập trước, bạn đã trích xuất các lỗi nội suy ước lượng từ đầu ra của missForest. Điều này cho bạn hai con số:

  • normalized root mean squared error (NRMSE) cho tất cả các biến liên tục;
  • proportion of falsely classified entries (PFC) cho tất cả các biến phân loại.

Tuy nhiên, rất có thể mô hình nội suy hoạt động rất tốt với một biến liên tục nhưng lại kém với biến khác! Để chẩn đoán các trường hợp như vậy, chỉ cần yêu cầu missForest tạo ước lượng lỗi theo từng biến. Thực hiện bằng cách đặt đối số variablewise thành TRUE.

Dữ liệu biopics và gói missForest đã được nạp sẵn cho bạn, vậy hãy xem kỹ hơn các lỗi này nhé!

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Dùng missForest để nội suy dữ liệu biopics sao cho các ước lượng lỗi theo biến được tính toán.