1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

EntityRuler cho NER

EntityRuler có thể kết hợp với EntityRecognizer của một mô hình hiện có để tăng độ chính xác. Trong bài tập này, bạn sẽ thực hành kết hợp một thành phần EntityRuler với thành phần NER sẵn có của mô hình en_core_web_sm. Mô hình đã được nạp sẵn dưới tên nlp.

Khi EntityRuler được thêm trước thành phần NER, bộ nhận diện thực thể sẽ tôn trọng các span thực thể đã có và điều chỉnh dự đoán dựa trên các mẫu được thêm vào EntityRuler để cải thiện độ chính xác của nhiệm vụ nhận diện thực thể có tên.

Hướng dẫn

100 XP
  • Thêm một EntityRuler vào nlp trước thành phần ner.
  • Định nghĩa một mẫu thực thể theo token để phân loại new york group (chữ thường) là ORG.
  • Thêm patterns vào thành phần EntityRuler.
  • Chạy mô hình và in ra tuple gồm văn bản thực thể và kiểu cho container Doc.