1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Khám sát mô hình của bạn

Giờ đây khi bạn đã xây dựng được một bộ phân loại "fake news", hãy tìm hiểu xem mô hình đã học được gì. Bạn có thể ánh xạ các trọng số vector quan trọng trở lại thành các từ thực tế bằng vài kỹ thuật kiểm tra đơn giản.

Bạn đang có sẵn bộ phân loại Naive Bayes với tf-idf hoạt động tốt là nb_classifier, và bộ biến đổi vector là tfidf_vectorizer.

Hướng dẫn

100 XP
  • Lưu các nhãn lớp vào class_labels bằng cách truy cập thuộc tính .classes_ của nb_classifier.
  • Trích xuất các đặc trưng bằng phương thức .get_feature_names() của tfidf_vectorizer.
  • Tạo một mảng zip giữa các hệ số của bộ phân loại với tên đặc trưng và sắp xếp theo giá trị hệ số. Cách làm: trước hết dùng zip() với các đối số nb_classifier.coef_[0] và feature_names. Sau đó dùng sorted() trên kết quả này.
  • In ra 20 đặc trưng có trọng số cao nhất cho nhãn đầu tiên của class_labels và 20 đặc trưng có trọng số thấp nhất cho nhãn thứ hai của class_labels. Phần này đã được làm sẵn cho bạn.