1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Gợi mở: phân cụm từ đơn giản

Trong chương tiếp theo, bạn sẽ học một số chủ đề rời (nhưng rất quan trọng) trong khai phá văn bản, gồm có:

  • Trọng số TDM/DTM
  • Xử lý độ thưa của TDM/DTM
  • Thu thập siêu dữ liệu (metadata)
  • Phân cụm từ đơn giản để tìm chủ đề
  • Phân tích với nhiều hơn một từ

Còn bây giờ, hãy tạo một trực quan mới gọi là dendrogram từ coffee_tweets. Chương sau sẽ giải thích chi tiết.

Hướng dẫn

100 XP

Một đối tượng phân cụm phân cấp, hc, đã được tạo sẵn cho bạn từ các tweet về cà phê.

Hãy tạo dendrogram bằng cách dùng plot() trên hc.