1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

EntityRuler với nhiều pattern trong spaCy

EntityRuler cho phép bạn thêm thực thể vào doc.ents và cải thiện hiệu suất nhận diện thực thể có tên. Trong bài tập này, bạn sẽ luyện cách thêm một thành phần EntityRuler vào pipeline nlp hiện có để đảm bảo nhiều thực thể được phân loại chính xác.

Mô hình en_core_web_sm đã được nạp sẵn và có sẵn dưới tên nlp. Bạn có thể truy cập văn bản ví dụ trong example_text và dùng nlp và doc để lần lượt truy cập mô hình spaCy và đối tượng Doc chứa example_text.

Hướng dẫn

100 XP
  • In danh sách các tuple gồm văn bản thực thể và kiểu của chúng trong example_text bằng mô hình nlp.
  • Định nghĩa nhiều pattern để khớp brother và sisters (chữ thường) với nhãn PERSON.
  • Thêm một thành phần EntityRuler vào pipeline nlp và thêm patterns vào EntityRuler.
  • In các tuple gồm văn bản và kiểu của thực thể cho example_text bằng mô hình nlp.