1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Tạo dữ liệu theo nội dung

Dù bạn rất muốn nhảy ngay vào việc tìm các mục tương tự và tạo gợi ý, trước hết bạn cần đưa dữ liệu về định dạng có thể sử dụng. Trong vài bài tập tiếp theo, bạn sẽ khám phá dữ liệu gốc và xử lý cách định dạng dữ liệu đó để dùng cho gợi ý dựa trên nội dung.

Nhắc lại: kết quả mong muốn là mỗi phim một hàng, với mỗi cột cho biết một thể loại có áp dụng cho phim đó hay không. Bạn sẽ xem movie_genre_df, gồm các cột sau:

  • name - Tên phim
  • genre_list - Thể loại mà phim được gán nhãn

Một phim có thể có nhiều thể loại, nên sẽ có nhiều hàng. Trong bài này, bạn sẽ tập trung vào một phim (trường hợp này là Toy Story) để dễ quan sát điều gì đang diễn ra với dữ liệu.

Hướng dẫn 1/3

undefined XP
    1
    2
    3

Câu hỏi

Có bao nhiêu phim khác nhau trong movie_genre_df?

Các phương án trả lời