1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Tổng hợp theo nhóm

Trong twitter_data có nhiều tweet không phàn nàn hơn tweet phàn nàn. Bạn có thể bắt đầu nghi ngờ liệu dữ liệu này có thực sự đến từ Twitter không! Còn vài cột khác trong twitter_data đáng để bạn khám phá trước khi đi vào nội dung tweet. Mỗi tweet bao gồm số lượng người theo dõi của người dùng đó trong cột usr_followers_count. Bạn có kỳ vọng những người phàn nàn sẽ có nhiều hay ít người theo dõi hơn, trung bình, so với những người không phàn nàn? Bạn có thể dùng các phép tổng hợp theo nhóm để tìm câu trả lời nhanh chóng và dễ dàng.

Hướng dẫn

100 XP
  • Nhóm dữ liệu theo complaint_label.
  • Tính giá trị trung bình, nhỏ nhất và lớn nhất của usr_followers_count.