1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Gán nhãn từ loại (POS) với spaCy

Trong bài tập này, bạn sẽ thực hành gán nhãn từ loại (POS). POS là một công cụ hữu ích trong NLP vì nó giúp thuật toán hiểu cấu trúc ngữ pháp của câu và xác định các từ có nhiều nghĩa như watch và play.

Trong bài tập này, en_core_web_sm đã được nạp sẵn dưới tên nlp. Ba bình luận từ bộ dữ liệu Airline Travel Information System (ATIS) đã được cung cấp cho bạn trong một danh sách gọi là texts.

Hướng dẫn

100 XP
  • Tạo documents, một danh sách gồm tất cả các doc tương ứng với từng văn bản trong danh sách texts bằng list comprehension.
  • Với mỗi doc, in ra văn bản của từng token và thẻ POS tương ứng bằng cách lặp qua documents và các token của mỗi doc bằng một vòng lặp for lồng nhau.