1. Aprende
  2. /
  3. Cursos
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Ejercicio

Công cụ gợi ý dựa trên cốt truyện

Trong bài tập này, chúng ta sẽ xây dựng một công cụ gợi ý phim dựa trên độ tương đồng của cốt truyện. Bạn đã được cung cấp hàm get_recommendations() nhận vào tiêu đề một bộ phim, một ma trận độ tương đồng và một Series indices làm tham số, rồi trả về danh sách các phim tương tự nhất. indices đã được cung cấp sẵn.

Bạn cũng có một Series movie_plots chứa cốt truyện của nhiều bộ phim. Nhiệm vụ của bạn là tạo ma trận độ tương đồng cosine cho các vector tf-idf của các cốt truyện này.

Sau đó, chúng ta sẽ kiểm tra độ hiệu quả của công cụ bằng cách tạo gợi ý cho một trong những bộ phim tôi yêu thích: The Dark Knight Rises.

Instrucciones

100 XP
  • Khởi tạo TfidfVectorizer với stop_words là tiếng Anh. Đặt tên là tfidf.
  • Tạo tfidf_matrix bằng cách fit và transform dữ liệu cốt truyện phim với fit_transform().
  • Sinh ma trận độ tương đồng cosine cosine_sim từ tfidf_matrix. Đừng dùng cosine_similarity()!
  • Dùng get_recommendations() để tạo gợi ý cho 'The Dark Knight Rises'.