1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Tạo dữ liệu huấn luyện (1)

Matcher theo luật của spaCy là cách tuyệt vời để nhanh chóng tạo dữ liệu huấn luyện cho mô hình nhận dạng thực thể có tên. Một danh sách câu có sẵn trong biến TEXTS. Bạn có thể in nó trong IPython shell để quan sát. Mục tiêu là tìm tất cả các đề cập đến các mẫu iPhone khác nhau, để chúng ta tạo dữ liệu huấn luyện giúp mô hình nhận diện chúng là 'GADGET'.

Đối tượng nlp đã được tạo sẵn cho bạn và Matcher có sẵn trong biến matcher.

Hướng dẫn

100 XP
  • Viết một pattern cho hai token có dạng chữ thường lần lượt khớp 'iphone' và 'x'.
  • Viết một pattern cho hai token: một token có dạng chữ thường khớp 'iphone' và một chữ số là tùy chọn dùng toán tử '?'.