1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Tìm các từ phổ biến nhất

Khi đã tạo xong các đặc trưng, bạn luôn nên kiểm tra lại để đảm bảo chúng đúng như kỳ vọng. Việc này giúp bạn phát hiện lỗi sớm và có thể định hướng cho các bước feature engineering tiếp theo.

Bộ vectorizer (cv) bạn đã fit ở bài trước và mảng thưa chứa số đếm từ (cv_trigram) hiện có sẵn trong workspace của bạn.

Hướng dẫn

100 XP
  • Tạo một DataFrame từ các đặc trưng (số đếm từ).
  • Cộng tổng số lần xuất hiện và in ra 5 từ xuất hiện nhiều nhất.