1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

So sánh từng phim bằng độ tương đồng Jaccard

Trong bài học trước, bạn đã tạo một DataFrame về các bộ phim, trong đó mỗi cột đại diện cho một thể loại khác nhau. Giờ bạn có thể dùng DataFrame này để so sánh phim bằng cách đo độ tương đồng Jaccard giữa các hàng. Điểm số Jaccard càng cao thì hai mục càng giống nhau.

Trong bài tập này, bạn sẽ so sánh phim GoldenEye với Toy Story, và GoldenEye với SkyFall, rồi đối chiếu kết quả.

DataFrame movie_cross_table chứa tất cả các phim dưới dạng hàng và các thể loại dưới dạng cột Boolean mà bạn đã tạo ở bài trước đã được nạp sẵn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Import hàm tính điểm tương đồng Jaccard từ sklearn.metrics.
  • 2
    • Chuyển các hàng chứa 'GoldenEye' và 'Toy Story' thành mảng numpy và đo độ tương đồng của chúng.
  • 3
    • Chuyển hàng chứa Skyfall thành mảng numpy và đo độ tương đồng của nó với GoldenEye.