1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Tạo DTM

Tạo một document-term matrix (DTM) từ dữ liệu tidy_twitter. Ở đây, mỗi tweet được xem như một tài liệu. In tidy_twitter ra console để kiểm tra tên các cột.

Hướng dẫn

100 XP
  • Bắt đầu từ dữ liệu Twitter đã được tidy.
  • Đếm mỗi từ được dùng trong từng tweet.
  • Dùng số lần xuất hiện của từ theo từng tweet để tạo DTM.