1. Learn
  2. /
  3. Courses
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Exercise

Bù đắp cho dữ liệu không đầy đủ

Với hầu hết các bộ dữ liệu, đa số người dùng chỉ đánh giá một số ít mục. Như bạn đã thấy ở bài trước, cách bạn xử lý người dùng không có đánh giá cho một mục có thể ảnh hưởng rất lớn đến độ tin cậy của mô hình.

Trong bài này, bạn sẽ điền dữ liệu khuyết bằng thông tin không làm thiên lệch phần dữ liệu hiện có.

Bạn sẽ lấy điểm trung bình mà mỗi người dùng đã cho trên tất cả các đánh giá của họ, rồi dùng giá trị trung bình này để đưa điểm của người dùng về quanh 0 (center). Cuối cùng, bạn có thể điền các giá trị trống bằng số 0 — nay là mức trung tính — giúp giảm thiểu tác động lên hồ sơ tổng thể của họ, đồng thời vẫn cho phép so sánh giữa các người dùng.

user_ratings_table với mỗi hàng là một người dùng đã được nạp sẵn cho bạn.

Instructions

100 XP
  • Tìm điểm trung bình của các đánh giá do mỗi người dùng đưa ra trong user_ratings_table và lưu thành avg_ratings.
  • Trừ trung bình hàng khỏi từng hàng trong user_ratings_table, và lưu lại thành user_ratings_table_centered.
  • Điền các giá trị trống trong user_ratings_table_centered mới tạo bằng số 0.