1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Huấn luyện và kiểm thử mô hình "tin giả" với TfidfVectorizer

Sau khi bạn đã đánh giá mô hình bằng CountVectorizer, giờ hãy làm tương tự với TfidfVectorizer kết hợp mô hình Naive Bayes.

Tập huấn luyện và kiểm thử đã được tạo, và tfidf_vectorizer, tfidf_train, cùng tfidf_test đã được tính sẵn. Ngoài ra, MultinomialNB và metrics cũng đã được import lần lượt từ sklearn.naive_bayes và sklearn.

Hướng dẫn

100 XP
  • Khởi tạo bộ phân loại MultinomialNB đặt tên là nb_classifier.
  • Huấn luyện bộ phân loại trên dữ liệu train.
  • Tính các nhãn dự đoán cho dữ liệu test.
  • Tính và in ra độ chính xác (accuracy) của bộ phân loại.
  • Tính ma trận nhầm lẫn. Như trong bài trước, chỉ định đối số từ khóa labels=['FAKE', 'REAL'] để ma trận nhầm lẫn dễ đọc hơn.