1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Chuyển văn bản thành DataFrame

Giờ bạn đã tạo được các đặc trưng đếm dưới dạng mảng, bạn cần định dạng lại để có thể kết hợp với phần còn lại của tập dữ liệu. Cách làm là chuyển mảng này thành một pandas DataFrame, dùng các tên đặc trưng bạn đã tìm được trước đó làm tên cột, rồi nối nó với DataFrame gốc.

Mảng numpy (cv_array) và vectorizer (cv) mà bạn đã fit ở bài trước có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Tạo một DataFrame cv_df chứa cv_array làm giá trị và dùng các tên đặc trưng làm tên cột.
  • Thêm tiền tố Counts_ vào tên các cột để dễ nhận diện.
  • Nối DataFrame này (cv_df) vào DataFrame gốc (speech_df) theo chiều cột.