1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Documents, spans and tokens

Khi bạn gọi nlp với một chuỗi, spaCy sẽ tách từ (tokenize) văn bản và tạo một đối tượng document. Trong bài tập này, bạn sẽ tìm hiểu thêm về Doc, cũng như các cách nhìn Token và Span.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Import lớp ngôn ngữ English và tạo đối tượng nlp.
  • Xử lý văn bản và khởi tạo đối tượng Doc trong biến doc.
  • Chọn token đầu tiên của Doc và in text của nó.