1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Pivot dữ liệu của bạn

Trong chương này, bạn sẽ tiến thêm một bước trong việc tạo gợi ý cá nhân hóa — bạn sẽ tìm các mục mà những người dùng có thị hiếu giống với người dùng đang được gợi ý đã thích.

Bước đầu tiên bạn cần làm là định dạng lại dữ liệu. Bạn bắt đầu với một tập dữ liệu chứa người dùng và các điểm đánh giá của họ dưới dạng từng hàng riêng lẻ với các cột sau:

  • user: ID người dùng
  • title: Tựa phim
  • rating: Điểm người dùng chấm cho phim

Bạn sẽ cần chuyển đổi DataFrame thành một ma trận điểm đánh giá của người dùng, trong đó mỗi hàng đại diện cho một người dùng và mỗi cột đại diện cho một bộ phim trên nền tảng. Cách này cho phép bạn dễ dàng so sánh người dùng và sở thích của họ.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Xem 5 hàng đầu tiên của DataFrame user_ratings để xác định những cột nào phù hợp nhất để pivot dữ liệu.