1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Khớp cụm từ hiệu quả

Đôi khi việc khớp các chuỗi chính xác sẽ hiệu quả hơn so với viết các mẫu mô tả từng token riêng lẻ. Điều này đặc biệt đúng với các tập hợp hữu hạn – như danh sách tất cả các quốc gia trên thế giới.

Bạn đã có một danh sách quốc gia, nên hãy dùng nó làm nền tảng cho script trích xuất thông tin. Danh sách tên dưới dạng chuỗi có trong biến COUNTRIES. Đối tượng nlp và một doc thử nghiệm đã được tạo sẵn và doc.text đã được in ra shell.

Hướng dẫn

100 XP
  • Import PhraseMatcher và khởi tạo nó với vocab dùng chung dưới biến matcher.
  • Thêm các mẫu cụm từ và gọi matcher trên doc.