1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Huấn luyện một mô hình NER hiện có

Một mô hình spaCy có thể không hoạt động tốt trên một tập dữ liệu nhất định. Một cách giải quyết là huấn luyện mô hình trên dữ liệu của bạn. Trong bài tập này, bạn sẽ thực hành huấn luyện một mô hình NER để cải thiện hiệu quả dự đoán.

Mô hình spaCy en_core_web_sm có sẵn dưới tên nlp hiện chưa thể dự đoán đúng house là một thực thể trong chuỗi test.

Với training_data đã cho, hãy viết các bước để cập nhật mô hình này khi lặp qua dữ liệu hai lần. Các pipeline khác đã được vô hiệu hóa và optimizer cũng đã sẵn sàng sử dụng. Số epoch đã được đặt là 2.

Hướng dẫn

100 XP
  • Sử dụng đối tượng optimizer và với mỗi epoch, hãy xáo trộn tập dữ liệu bằng gói random và tạo đối tượng Example.
  • Cập nhật mô hình nlp bằng thuộc tính .update và đặt tham số sgd để sử dụng optimizer.