1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Huấn luyện và kiểm thử mô hình "fake news" với CountVectorizer

Giờ đến lượt bạn huấn luyện mô hình "fake news" bằng các đặc trưng bạn đã xác định và trích xuất. Trong bài này, bạn sẽ huấn luyện và kiểm thử một mô hình Naive Bayes sử dụng dữ liệu từ CountVectorizer.

Tập huấn luyện và tập kiểm thử đã được tạo sẵn, và count_vectorizer, count_train, cùng count_test đã được tính toán.

Hướng dẫn

100 XP
  • Import mô-đun metrics từ sklearn và MultinomialNB từ sklearn.naive_bayes.
  • Khởi tạo một bộ phân loại MultinomialNB tên là nb_classifier.
  • Huấn luyện bộ phân loại trên dữ liệu huấn luyện.
  • Tính các nhãn dự đoán cho dữ liệu kiểm thử.
  • Tính và in ra điểm độ chính xác (accuracy) của bộ phân loại.
  • Tính ma trận nhầm lẫn. Để dễ đọc hơn, chỉ định đối số từ khóa labels=['FAKE', 'REAL'].