1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xây dựng Recommendation Engine bằng Python

Connected

Bài tập

Tạo DataFrame TF-IDF

Giờ bạn đã tạo được các đặc trưng TF-IDF, bạn cần đưa chúng về định dạng có thể dùng để tạo gợi ý. Bạn sẽ tiếp tục tận dụng pandas và bọc mảng này trong một DataFrame. Vì bạn sẽ dùng tựa phim để lọc dữ liệu, bạn có thể gán các tựa phim vào chỉ mục (index) của DataFrame.

DataFrame df_plots đã được nạp sẵn cho bạn. Nó chứa tên phim trong cột Title và phần tóm tắt nội dung trong cột Plot.

Hướng dẫn

100 XP
  • Tạo một TfidfVectorizer rồi fit và transform như bạn đã làm ở bài trước.
  • Bọc vectorized_data đã tạo trong một DataFrame. Dùng tên các đặc trưng được sinh ra trong giai đoạn fit và transform làm tên cột và gán DataFrame mới của bạn vào tfidf_df.
  • Gán các tựa phim gốc vào index của DataFrame tfidf_df vừa tạo.