1. Learn
  2. /
  3. Courses
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Exercise

Vector hóa văn bản

Bây giờ bạn sẽ biến đổi cột desc trong bộ dữ liệu UFO thành các vector tf/idf, vì nhiều khả năng có điều gì đó hữu ích chúng ta có thể học được từ trường này.

Instructions

100 XP
  • In .head() của cột desc.
  • Khởi tạo một đối tượng TfidfVectorizer().
  • Fit và transform cột desc bằng vec.
  • In .shape của vector desc_tfidf để xem số lượng cột được tạo ra.