1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるテキスト分析

Connected

演習

グループ化した要約

twitter_data では、苦情ではないツイートのほうが苦情ツイートより多いようです。本当にTwitterのデータなのか、少し疑問に感じ始めたかもしれません。ツイート本文に入る前に、twitter_data には他にも調べておくとよい列があります。各ツイートには、そのユーザーのフォロワー数が usr_followers_count 列に含まれています。苦情を投稿する人は、平均して苦情を投稿しない人よりフォロワーが多いと思いますか?それとも少ないと思いますか?グループ化した要約を使えば、手早くその答えを確認できます。

指示

100 XP
  • complaint_label でデータをグループ化します。
  • usr_followers_count の平均、最小、最大を計算します。