1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Huấn luyện Naive Bayes với chọn lọc đặc trưng

Giờ bạn sẽ chạy lại mô hình phân loại văn bản Naive Bayes mà bạn đã thực hiện ở cuối Chương 3, với các lựa chọn đặc trưng từ bài trước: hai cột title và category_desc của tập dữ liệu volunteer.

Hướng dẫn

100 XP
  • Dùng train_test_split() trên vector văn bản filtered_text, nhãn y (chính là nhãn category_desc), và truyền tập y vào tham số stratify, vì chúng ta có phân bố lớp không đều.
  • Fit mô hình Naive Bayes nb với X_train và y_train.
  • Tính độ chính xác trên tập kiểm tra của nb.