1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Đếm theo sản phẩm và sắp xếp lại

tidy_twitter đã được tách token và đã loại bỏ stop words, bao gồm cả stop words tùy chỉnh. Bạn muốn trực quan hóa sự khác biệt về số lần xuất hiện từ dựa trên khiếu nại và không khiếu nại.

Hướng dẫn

100 XP
  • Đếm từ theo việc đó có phải là khiếu nại hay không.
  • Giữ lại 20 từ hàng đầu theo việc đó có phải là khiếu nại hay không.
  • Bỏ nhóm (ungroup) trước khi sắp xếp lại word dưới dạng factor theo số đếm.