1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu khuyết bằng Imputation trong R

Connected

Bài tập

Mẹo kNN I: gán trọng số cho donor

Một biến thể của phép bù kNN thường được áp dụng là gộp theo khoảng cách có trọng số (distance-weighted). Nghĩa là khi bạn gộp các giá trị từ các láng giềng để thay thế cho một giá trị bị thiếu, bạn dùng trung bình có trọng số, trong đó trọng số là nghịch đảo của khoảng cách tới từng láng giềng. Nhờ vậy, láng giềng gần hơn sẽ ảnh hưởng nhiều hơn đến giá trị được bù.

Trong bài này, bạn sẽ áp dụng cách gộp có trọng số theo khoảng cách khi bù dữ liệu tao. Bạn chỉ cần truyền thêm hai đối số cho hàm kNN(). Hãy thử nhé!

Hướng dẫn

100 XP
  • Nạp gói VIM.
  • Bù khuyết humidity bằng kNN với trung bình có trọng số theo khoảng cách để gộp láng giềng; bạn cần chỉ định các đối số numFun và weightDist.
  • Biểu đồ lề để xem kết quả đã được viết sẵn cho bạn.