1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

EntityRuler với mô hình spaCy trống

EntityRuler cho phép bạn thêm các thực thể vào doc.ents. Nó có thể được kết hợp với EntityRecognizer (một thành phần trong pipeline của spaCy dùng cho nhận dạng thực thể có tên) để cải thiện độ chính xác, hoặc dùng độc lập để xây dựng hệ thống nhận dạng thực thể thuần theo luật. Trong bài tập này, bạn sẽ luyện tập thêm một thành phần EntityRuler vào mô hình tiếng Anh spaCy trống và phân loại các thực thể có tên trong text được cung cấp bằng phương pháp nhận dạng thực thể thuần theo luật.

Gói spaCy đã được import và một mô hình tiếng Anh spaCy trống đã sẵn sàng dưới tên nlp. Một danh sách patterns để phân loại openai và microsoft viết thường thành ORG cũng đã được chuẩn bị để bạn sử dụng.

Hướng dẫn

100 XP
  • Tạo và thêm một thành phần EntityRuler vào pipeline.
  • Thêm các pattern đã cho vào thành phần EntityRuler.
  • Chạy mô hình trên text đã cho và tạo Doc tương ứng.
  • In ra các bộ (văn bản thực thể, loại thực thể) cho tất cả thực thể trong Doc