1. 学ぶ
  2. /
  3. コース
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

演習

Vẽ word cloud tốt hơn

Giờ bạn đã loại bỏ thêm các stopword, hãy xem word cloud đã được cải thiện!

Ma trận thuật ngữ - tài liệu từ bài trước đã được chuyển thành ma trận bằng as.matrix(), rồi tạo một vector có tên bằng rowSums(). Đối tượng mới về tần suất thuật ngữ tên là chardonnay_words đã được nạp sẵn vào workspace của bạn. Hãy xem các kết quả word cloud mới này.

指示

100 XP

Chúng tôi đã nạp sẵn gói wordcloud cho bạn ở phía sau và sẽ tiếp tục làm vậy cho mọi bài tập cần đến nó.

  • Sắp xếp các giá trị trong chardonnay_words với decreasing = TRUE. Lưu thành sorted_chardonnay_words.
  • Xem 6 từ đứng đầu trong sorted_chardonnay_words và các giá trị của chúng.
  • Tạo terms_vec bằng names() trên chardonnay_words.
  • Truyền terms_vec và chardonnay_words vào hàm wordcloud(). Xem lại những từ nào nổi bật lên bây giờ khi "chardonnay" đã được loại bỏ.