1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Độ thưa của ma trận

Một thách thức phổ biến với dữ liệu đánh giá trong thế giới thực là hầu hết người dùng sẽ không đánh giá hầu hết các mục, và hầu hết các mục chỉ được một số ít người dùng đánh giá. Điều này dẫn đến một DataFrame rất rỗng hoặc thưa.

Trong bài tập này, bạn sẽ tính độ thưa của dữ liệu đánh giá movie_lens bằng cách đếm số ô đã được điền và so sánh với kích thước của toàn bộ DataFrame. DataFrame user_ratings_df mà bạn đã dùng ở các bài trước, trong đó mỗi hàng là một người dùng và mỗi cột là một bộ phim, đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Đếm số ô không trống trong user_ratings_df và lưu kết quả vào sparsity_count.
  • Đếm tổng số ô trong DataFrame user_ratings_df và lưu vào full_count.
  • Tính độ thưa của DataFrame bằng cách chia số ô không trống cho tổng số ô và in kết quả.