1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

So sánh toàn bộ phim của bạn với TF-IDF

Sau khi bạn đã vất vả chuyển dữ liệu TF-IDF sang định dạng có thể sử dụng, giờ là lúc dùng nó để tìm độ tương đồng và tạo gợi ý.

Lần này, vì bạn dùng điểm TF-IDF (là số thực thay vì Boolean), bạn sẽ dùng độ đo cosine similarity để tìm độ giống nhau giữa các mục. Trong bài tập này, bạn sẽ tạo một ma trận chứa tất cả cosine similarity giữa các bộ phim và lưu chúng vào một DataFrame để tiện tra cứu. Cách này cho phép bạn so sánh phim và tìm gợi ý nhanh chóng, dễ dàng.

DataFrame tfidf_df bạn đã tạo ở bài trước, trong đó mỗi hàng là một bộ phim, đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Tìm các độ đo cosine similarity giữa tất cả các phim và gán kết quả vào cosine_similarity_array.
  • Tạo một DataFrame từ cosine_similarity_array với tfidf_summary_df.index làm cả chỉ mục hàng và cột.
  • In 5 hàng đầu tiên của DataFrame và xem xét các điểm tương đồng.