1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Thuộc tính từ vựng (Lexical attributes)

Trong ví dụ này, bạn sẽ dùng các đối tượng Doc và Token của spaCy, cùng các thuộc tính từ vựng để tìm phần trăm trong văn bản. Bạn sẽ tìm hai token liên tiếp: một số và ký hiệu phần trăm. Đối tượng nlp cho tiếng Anh đã được tạo sẵn.

Hướng dẫn

100 XP
  • Dùng thuộc tính like_num của token để kiểm tra liệu một token trong doc có giống một con số hay không.
  • Lấy token đứng ngay sau token hiện tại trong tài liệu. Chỉ số của token tiếp theo trong doc là token.i + 1.
  • Kiểm tra xem thuộc tính text của token tiếp theo có phải là ký hiệu phần trăm "%" hay không.