1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Tạo gợi ý với TF-IDF

Ở bài trước, bạn đã tính sẵn điểm tương đồng giữa tất cả các phim trong tập dữ liệu dựa trên phần tóm tắt (plot) đã được biến đổi bằng TF-IDF. Giờ bạn sẽ đưa các điểm tương đồng này vào một DataFrame để tiện sử dụng. Sau đó, bạn sẽ dùng DataFrame mới này để đề xuất một phim.

Mảng cosine_similarity_array chứa ma trận giá trị độ tương đồng giữa mọi cặp phim mà bạn đã tạo ở bài trước đã được nạp sẵn cho bạn. DataFrame tfidf_summary_df chứa danh sách phim và các đặc trưng TF-IDF của chúng cũng đã sẵn sàng.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tạo một DataFrame từ cosine_similarity_array.
  • Lưu các giá trị cosine similarity giữa phim Rio và tất cả các phim khác thành một Series.
  • Sắp xếp các giá trị này từ lớn đến nhỏ trong ordered_similarities và in ra kết quả đã sắp xếp.