1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Bài tập

So sánh hiệu năng của các mô hình n-gram

Giờ bạn đã biết cách phân tích cảm xúc bằng cách chuyển văn bản thành nhiều biểu diễn n-gram khác nhau và đưa chúng vào một bộ phân loại. Trong bài tập này, chúng ta sẽ phân tích cảm xúc cho cùng tập đánh giá phim như trước bằng hai mô hình n-gram: unigram và n-gram với n tối đa bằng 3.

Sau đó, chúng ta sẽ so sánh hiệu năng theo ba tiêu chí: độ chính xác của mô hình trên tập kiểm tra, thời gian chạy chương trình và số lượng đặc trưng được tạo ra khi sinh biểu diễn n-gram.

Hướng dẫn 1/2

undefined XP
  • 1

    Khởi tạo một đối tượng CountVectorizer sao cho nó tạo ra unigram.

  • 2

    Khởi tạo một đối tượng CountVectorizer sao cho nó tạo ra n-gram với n tối đa bằng 3.