1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Exercise

Các từ tương tự trong một từ vựng

Tìm các thuật ngữ tương đồng về ngữ nghĩa có nhiều ứng dụng trong truy hồi thông tin. Trong bài tập này, bạn sẽ luyện tìm thuật ngữ có mức tương đồng ngữ nghĩa cao nhất với từ computer từ kho từ vựng của mô hình en_core_web_md.

Vector từ của computer đã được trích xuất và lưu trong word_vector. Mô hình en_core_web_md đã được nạp vào biến nlp, và gói NumPy đã được nạp là np.

Bạn có thể dùng hàm .most_similar() của đối tượng nlp.vocab.vectors để tìm các thuật ngữ tương đồng ngữ nghĩa nhất. Dùng [0][0] để đánh chỉ mục đầu ra của hàm này sẽ trả về các ID từ của những thuật ngữ tương đồng ngữ nghĩa. Có thể dùng nlp.vocab.strings[<một từ cho trước>] để tìm ID của một từ cho trước và tương tự cũng có thể trả về từ gắn với một ID từ cho trước.

Instructions

100 XP
  • Tìm thuật ngữ tương đồng ngữ nghĩa nhất từ từ vựng en_core_web_md.
  • Tìm danh sách các từ tương tự dựa trên các ID từ của những thuật ngữ tương tự.