1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Thành phần với extension

Extension attribute đặc biệt mạnh khi kết hợp với các thành phần (component) tùy chỉnh trong pipeline. Trong bài này, bạn sẽ viết một pipeline component để tìm tên các quốc gia và một extension attribute tùy chỉnh trả về thủ đô của quốc gia đó, nếu có.

Đối tượng nlp đã được tạo và lớp Span đã được import. Một phrase matcher chứa tất cả quốc gia có sẵn trong biến matcher. Một dictionary ánh xạ các quốc gia sang thủ đô của chúng có sẵn trong biến capitals.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Hoàn thiện countries_component và tạo Span với nhãn 'GPE' (thực thể địa chính trị) cho tất cả các khớp (matches).
  • Thêm component này vào pipeline.