1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Thành phần phức tạp

Trong bài tập này, bạn sẽ viết một thành phần tùy chỉnh dùng PhraseMatcher để tìm tên các loài động vật trong văn bản và thêm các span khớp được vào doc.ents.

Một PhraseMatcher với các mẫu động vật đã được tạo sẵn dưới biến matcher. Mô hình tiếng Anh nhỏ có sẵn dưới biến nlp. Đối tượng Span cũng đã được nhập sẵn cho bạn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Định nghĩa thành phần tùy chỉnh và áp dụng matcher lên doc.
  • Tạo một Span cho mỗi kết quả khớp, gán ID nhãn cho 'ANIMAL' và ghi đè doc.ents bằng các span mới.