1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Độ tương đồng của Span với spaCy

Xác định độ tương đồng ngữ nghĩa giúp bạn phân loại văn bản vào các nhóm định sẵn, phát hiện văn bản liên quan, hoặc gắn cờ nội dung trùng lặp. Trong bài tập này, bạn sẽ luyện tính độ tương đồng ngữ nghĩa giữa các span của một tài liệu với một tài liệu cho trước. Mục tiêu là tìm Span gồm ba token liên quan nhất đến canned dog food (thức ăn chó đóng hộp).

Nhóm chủ đề canned dog food đã được lưu trong category. Chuỗi văn bản đã có sẵn trong đối tượng text và mô hình en_core_web_md đã được nạp dưới tên nlp. Doc của text cũng đã được tạo và lưu trong document.

Hướng dẫn

100 XP
  • Tạo một Doc cho category và lưu vào category_document.
  • In điểm tương đồng giữa một Span đã cho và category_document, làm tròn đến ba chữ số thập phân.