1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Ngôn ngữ Nói bằng Python

Connected

Bài tập

Tạo thực thể có tên tùy chỉnh trong spaCy

Nếu các thực thể có tên dựng sẵn của spaCy là chưa đủ, bạn có thể tự tạo bằng lớp EntityRuler() của spaCy.

EntityRuler() cho phép bạn tạo thực thể riêng để thêm vào pipeline của spaCy.

Bạn bắt đầu bằng cách tạo một instance của EntityRuler() và truyền vào pipeline hiện tại, nlp.

Sau đó bạn có thể gọi add_patterns() trên instance này và truyền vào một từ điển chứa pattern văn bản mà bạn muốn gán nhãn thực thể.

Khi đã thiết lập xong pattern, bạn có thể thêm nó vào pipeline nlp bằng add_pipe().

Vì Acme là một công ty công nghệ, bạn quyết định gắn pattern "smartphone" với nhãn thực thể "PRODUCT".

spaCy đã được import và một doc đã tồn tại, chứa văn bản đã được chuyển từ tiếng nói trong tệp call_4_channel_2.wav file).

Hướng dẫn

100 XP
  • Import EntityRuler từ spacy.pipeline.
  • Thêm "smartphone" làm giá trị cho khóa "pattern".
  • Thêm instance EntityRuler(), ruler, vào pipeline nlp.
  • In ra các thuộc tính thực thể có trong doc.