1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Loại bỏ các thuật ngữ thưa

Chạy các mô hình phân loại trên ma trận thưa có thể là một cơn ác mộng về tính toán. Nếu không có GPU hoặc tài nguyên điện toán đám mây, bạn có thể gặp vấn đề về thời gian và bộ nhớ trên máy tính cá nhân. Bạn được cung cấp một ma trận tài liệu–thuật ngữ và dự định chạy nhiều thuật toán khác nhau để tìm mô hình phân loại tốt nhất. Trong bài tập này, bạn sẽ loại bỏ một số thuật ngữ thưa khỏi ma trận matrix được cung cấp ở các mức độ thưa khác nhau.

Với mỗi mức độ thưa, hãy ghi lại số lượng thuật ngữ còn lại trong ma trận.

Hướng dẫn 1/4

undefined XP
  • 1
    • Loại bỏ các thuật ngữ thưa khỏi ma trận tài liệu–thuật ngữ matrix với giá trị .50.
  • 2
    • Loại bỏ các thuật ngữ thưa khỏi ma trận tài liệu–thuật ngữ matrix với giá trị .90.
  • 3
    • Loại bỏ các thuật ngữ thưa khỏi ma trận tài liệu–thuật ngữ matrix với giá trị .99.
  • 4
    • Loại bỏ các thuật ngữ thưa khỏi ma trận tài liệu–thuật ngữ matrix với giá trị .9999.