1. 学ぶ
  2. /
  3. コース
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

演習

Phân giải đa nghĩa từ với spaCy

WSD là một bài toán kinh điển nhằm quyết định nghĩa nào của một từ được dùng trong câu. Xác định đúng nghĩa của từ rất quan trọng trong công cụ tìm kiếm, dịch máy và hệ thống hỏi-đáp. Trong bài tập này, bạn sẽ luyện dùng gán nhãn từ loại (POS tagging) để phân giải đa nghĩa từ.

Có hai câu chứa từ jam, với hai nghĩa khác nhau, và nhiệm vụ của bạn là xác định các nhãn POS để giúp suy ra nghĩa tương ứng của từ trong từng câu.

Hai câu đã có sẵn trong danh sách texts. Mô hình en_core_web_sm đã được nạp và sẵn dùng dưới tên nlp.

指示1 / 2

undefined XP
    1
    2
  • Tạo danh sách documents chứa các Doc ứng với từng phần tử trong danh sách texts.
  • In ra một tuple gồm văn bản của token và nhãn POS cho mỗi Doc chỉ khi từ jam xuất hiện trong văn bản của token.