1. Learn
  2. /
  3. Courses
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Exercise

Dự đoán cảm xúc của một bài đánh giá phim

Trong bài trước, bạn đã tạo biểu diễn bag-of-words cho dữ liệu đánh giá phim của tập huấn luyện và tập kiểm tra. Trong bài này, chúng ta sẽ dùng mô hình đó để huấn luyện một bộ phân loại Naive Bayes có thể nhận diện cảm xúc của bài đánh giá phim và tính độ chính xác của nó. Lưu ý: vì đây là bài toán phân loại nhị phân, mô hình chỉ có thể phân loại một bài đánh giá là tích cực (1) hoặc tiêu cực (0). Mô hình không thể phát hiện các đánh giá trung lập.

Nếu bạn chưa nhớ, các vector BoW của tập huấn luyện và tập kiểm tra lần lượt có trong X_train_bow và X_test_bow. Nhãn tương ứng lần lượt có trong y_train và y_test. Ngoài ra, để bạn tham khảo, bộ dữ liệu đánh giá phim gốc có trong df.

Instructions

100 XP
  • Khởi tạo một đối tượng MultinomialNB. Đặt tên là clf.
  • Fit clf với X_train_bow và y_train.
  • Đo độ chính xác của clf bằng X_test_bow và y_test.