1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Exercise

Mẹo hot-deck II: sắp xếp theo biến tương quan

Một mẹo khác có thể cải thiện hiệu quả của hot-deck imputation là sắp xếp dữ liệu theo các biến có tương quan với biến bạn muốn nội suy.

Chẳng hạn, trong tất cả các biểu đồ lề mà bạn vừa vẽ, bạn thấy nhiệt độ không khí tương quan chặt chẽ với nhiệt độ bề mặt biển — điều này rất hợp lý. Bạn có thể tận dụng hiểu biết này để cải thiện hot-deck imputation. Nếu bạn sắp xếp dữ liệu theo sea_surface_temp trước, thì mỗi giá trị air_temp được nội suy sẽ lấy từ một donor có sea_surface_temp tương tự. Hãy xem cách nó hoạt động!

Instructions

100 XP
  • Thực hiện hot-deck imputation cho các giá trị thiếu trong air_temp của dữ liệu tao, sắp xếp theo sea_surface_temp và gán kết quả cho tao_imp.
  • Tạo biểu đồ lề (margin plot) của air_temp so với sea_surface_temp.