1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Khám phá các giá trị Tf-idf

Sau khi tạo các đặc trưng Tf-idf, bạn thường muốn biết những từ nào có điểm cao nhất trong mỗi corpus. Bạn có thể làm điều này bằng cách lấy riêng hàng bạn muốn xem và sắp xếp các điểm từ cao xuống thấp.

DataFrame từ bài tập trước (tv_df) đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Gán hàng đầu tiên của tv_df vào sample_row.
  • sample_row hiện là một series trọng số gán cho các từ. Hãy sắp xếp các giá trị này để in ra 5 từ có điểm cao nhất.