1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Cải thiện mô hình của bạn

Nhiệm vụ của bạn trong bài này là thử một vài mức alpha khác nhau bằng cách dùng các vector Tfidf để xem có tổ hợp nào đạt hiệu năng tốt hơn không.

Các tập huấn luyện và kiểm tra đã được tạo sẵn, và tfidf_vectorizer, tfidf_train, cùng tfidf_test đã được tính toán.

Hướng dẫn

100 XP
  • Tạo một danh sách các giá trị alpha để thử bằng np.arange(). Giá trị nên nằm trong khoảng từ 0 đến 1 với bước 0.1.
  • Tạo một hàm train_and_predict() nhận một đối số: alpha. Hàm cần:
    • Khởi tạo bộ phân loại MultinomialNB với alpha=alpha.
    • Fit vào dữ liệu huấn luyện.
    • Tính dự đoán trên dữ liệu kiểm tra.
    • Tính và trả về độ chính xác.
  • Dùng một vòng lặp for, in ra alpha, score và một dòng trống xen giữa. Dùng hàm train_and_predict() của bạn để tính score. Điểm số có thay đổi theo alpha không? Alpha nào là tốt nhất?