1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Độ tương đồng Doc với spaCy

Độ tương đồng ngữ nghĩa là quá trình phân tích nhiều câu để xác định điểm giống nhau giữa chúng. Trong bài tập này, bạn sẽ luyện cách tính độ tương đồng ngữ nghĩa của các tài liệu so với một tài liệu cho trước. Mục tiêu là phân loại một danh sách đánh giá có liên quan đến thức ăn chó đóng hộp.

Hạng mục thức ăn chó đóng hộp được lưu ở category. Một mẫu gồm năm bài đánh giá thức ăn đã được cung cấp trong danh sách texts. en_core_web_md đã được nạp là nlp.

Hướng dẫn

100 XP
  • Tạo danh sách documents chứa các Doc của toàn bộ texts.
  • Tạo một Doc từ category và lưu là category_document.
  • Duyệt qua documents và in điểm tương đồng của từng Doc với category_document, làm tròn đến ba chữ số thập phân.