1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Trích xuất quốc gia và mối quan hệ

Trong bài trước, bạn đã viết một script dùng PhraseMatcher của spaCy để tìm tên các quốc gia trong văn bản. Bây giờ, hãy dùng bộ khớp quốc gia đó trên một văn bản dài hơn, phân tích cú pháp và cập nhật thực thể (entities) của tài liệu với các quốc gia đã khớp. Đối tượng nlp đã được tạo sẵn.

Văn bản có trong biến text, PhraseMatcher với các mẫu quốc gia có trong biến matcher. Lớp Span đã được import.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Lặp qua các kết quả khớp và tạo một Span với nhãn "GPE" (thực thể địa chính trị).
  • Ghi đè các thực thể trong doc.ents và thêm span đã khớp.