1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

So sánh TFIDF tibble và dtm

TFIDF có thể dùng cho đo độ tương đồng tài liệu, phân loại văn bản và các tác vụ khác. Xét tibble left_right_tfidf và ma trận tài liệu–từ left_right_matrix. Cả hai đã được nạp vào console.

Phát biểu nào sau đây là đúng?

  • A: Tibble có một hàng cho mỗi tài liệu và một cột cho mỗi từ xuất hiện trong toàn bộ văn bản.
  • B: Tibble chứa số lần xuất hiện từ, tf, idf, và trọng số tfidf cho từng từ trong từng tài liệu.
  • C: Tibble và ma trận có cùng số hàng.
  • D: Các cột của ma trận tài liệu–từ có thể dùng trong các mô hình phân loại.

Hướng dẫn

50 XP

Các phương án trả lời