1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Vector hóa văn bản

Bây giờ bạn sẽ biến đổi cột title của bộ dữ liệu volunteer thành một vector văn bản, và bạn sẽ dùng nó cho một bài toán dự đoán ở bài tập tiếp theo.

Hướng dẫn

100 XP
  • Lưu cột volunteer["title"] vào một biến tên là title_text.
  • Khởi tạo một TfidfVectorizer với tên tfidf_vec.
  • Biến đổi văn bản trong title_text thành một vector tf-idf bằng tfidf_vec.