1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Hot-deck dạng cơ bản

Hot-deck imputation là một phương pháp đơn giản: thay thế mỗi giá trị khuyết trong một biến bằng giá trị quan sát gần nhất trước đó của chính biến đó. Cách này rất nhanh vì chỉ cần duyệt dữ liệu một lần, nhưng ở dạng đơn giản nhất, hot-deck đôi khi có thể làm mất quan hệ giữa các biến.

Trong bài tập này, bạn sẽ thử áp dụng trên bộ dữ liệu tao. Bạn sẽ dùng hot-deck để bù khuyết cho cột nhiệt độ không khí air_temp, rồi vẽ biểu đồ biên (margin plot) để phân tích mối quan hệ giữa các giá trị đã bù với cột nhiệt độ bề mặt biển sea_surface_temp. Cùng xem nó hoạt động thế nào!

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Nạp gói VIM.