1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Container Doc trong spaCy

Bước đầu tiên của pipeline xử lý văn bản bằng spaCy là chuyển một chuỗi văn bản thành một Doc container, nơi lưu trữ văn bản đã được xử lý. Trong bài tập này, bạn sẽ thực hành tải mô hình spaCy, tạo đối tượng nlp(), tạo Doc container và xử lý một chuỗi text đã được cung cấp.

Mô hình en_core_web_sm đã được tải sẵn.

Hướng dẫn

100 XP
  • Tải en_core_web_sm và tạo một đối tượng nlp.
  • Tạo một doc container từ chuỗi text.
  • Tạo một list chứa phần text của từng token trong doc container.