1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Chuẩn hóa dữ liệu của bạn

Trước khi bạn có thể tìm các thừa số của ma trận điểm đánh giá bằng phương pháp phân rã giá trị kỳ dị (singular value decomposition), bạn cần “khử trung bình” (de-mean), hay còn gọi là đưa dữ liệu về tâm, bằng cách trừ đi giá trị trung bình của từng hàng khỏi mỗi giá trị trong hàng đó.

Trong bài này, bạn sẽ bắt đầu chuẩn bị DataFrame điểm phim mà bạn đã làm việc để có thể thực hiện Singular value decomposition.

user_ratings_df chứa một hàng cho mỗi người dùng và một cột cho mỗi bộ phim, và đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Tìm điểm trung bình mà mỗi người dùng đã cho trên tất cả các phim họ đã xem và lưu các giá trị này vào avg_ratings.
  • Trừ trung bình của từng hàng khỏi chính hàng đó và lưu kết quả vào user_ratings_centered.
  • Cuối cùng, điền tất cả giá trị khuyết trong user_ratings_centered bằng số 0.
  • In trung bình của mỗi cột trong user_ratings_centered để cho thấy dữ liệu đã được khử trung bình.