1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Đếm số từ (II)

Sau khi vectorizer được fit với dữ liệu, bạn có thể dùng nó để biến đổi văn bản thành một mảng biểu diễn số lần xuất hiện của từ. Mảng này sẽ có một hàng cho mỗi khối văn bản và một cột cho mỗi đặc trưng do vectorizer tạo ra mà bạn đã thấy ở bài tập trước.

Vectorizer mà bạn đã fit ở bài tập trước (cv) có sẵn trong không gian làm việc của bạn.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Áp dụng vectorizer lên cột text_clean.
  • Chuyển mảng (thưa) đã biến đổi này thành một mảng numpy chứa số đếm.