1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Ôn tập phương pháp #2

Trong bài tập này, bạn sẽ ôn lại bốn phương pháp bổ sung.

  • e: Các kỹ thuật mô hình hóa, bao gồm LDA, dùng để gom văn bản vào các nhóm hoặc loại dựa trên các từ được dùng tương tự nhau.
  • f: Một phương pháp để quét văn bản và gắn thẻ các từ phân biệt con người, địa điểm hoặc tổ chức.
  • g: Phương pháp dùng để tìm kiếm các mẫu cụ thể trong văn bản.
  • h: Biểu diễn từ bằng một không gian vector lớn, trong đó các từ tương tự nằm gần nhau trong không gian vector.

Hướng dẫn

100 XP
  • Dựa trên 4 mô tả ở trên, gán mô hình hoặc phương pháp bằng chữ cái tương ứng.