1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Độ tương đồng ngữ nghĩa để phân loại văn bản

Mục tiêu chính của độ tương đồng ngữ nghĩa là đo khoảng cách giữa ý nghĩa ngữ nghĩa của một cặp từ, cụm từ, câu hoặc tài liệu. Ví dụ, từ “car” giống “bus” hơn là “cat”. Trong bài tập này, bạn sẽ tìm các câu giống với từ sauce từ một văn bản ví dụ trong Amazon Fine Food Reviews. Bạn có thể dùng spacy để tính điểm tương đồng giữa từ sauce và từng câu trong chuỗi texts đã cho, rồi báo cáo điểm của câu giống nhất.

Một chuỗi texts đã được nạp sẵn, chứa toàn bộ dữ liệu Text của các đánh giá. Bạn sẽ dùng mô hình tiếng Anh en_core_web_md cho bài này, đã có sẵn dưới tên nlp.

Hướng dẫn

100 XP
  • Dùng nlp để tạo Doc cho từ sauce và cho texts, lưu lần lượt vào key và sentences.
  • Tính điểm tương đồng giữa từ sauce và từng câu trong chuỗi texts (làm tròn đến hai chữ số).