1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

So sánh NER của NLTK với spaCy

Với cùng đoạn văn bản bạn đã dùng ở bài tập đầu của chương này, giờ bạn sẽ xem kết quả khi dùng bộ gán nhãn NER của spaCy. Kết quả sẽ khác nhau thế nào?

Bài báo đã được nạp sẵn là article. Để giảm thời gian chạy, bạn sẽ cần chỉ định đối số từ khóa disable=['tagger', 'parser', 'matcher'] khi tải mô hình spaCy, vì trong bài này bạn chỉ quan tâm đến entity.

Hướng dẫn

100 XP
  • Import spacy.
  • Tải mô hình 'en_core_web_sm' bằng spacy.load(). Chỉ định thêm đối số từ khóa disable=['tagger', 'parser', 'matcher'].
  • Tạo một đối tượng tài liệu của spacy bằng cách truyền article vào nlp().
  • Dùng ent làm biến lặp, duyệt qua các thực thể của doc và in ra nhãn (ent.label_) cùng văn bản (ent.text).