1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Bài tập

N-gram bậc cao cho phân tích cảm xúc

Tương tự một bài tập trước, bạn sẽ xây dựng một bộ phân loại để phát hiện xem bài đánh giá về một bộ phim là tích cực hay tiêu cực. Tuy nhiên, lần này chúng ta sẽ dùng n-gram đến n=2 cho tác vụ này.

Các đánh giá dùng để huấn luyện theo n-gram có trong X_train_ng. Các đánh giá kiểm thử tương ứng có trong X_test_ng. Cuối cùng, dùng y_train và y_test để truy cập lần lượt các nhãn cảm xúc của tập huấn luyện và kiểm thử.

Hướng dẫn

100 XP
  • Tạo một đối tượng MultinomialNB và đặt tên là clf_ng.
  • Fit bộ phân loại trên X_train_ng và y_train.
  • Đo accuracy trên X_test_ng và y_test bằng phương thức score().