1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるテキスト分析

Connected

演習

クリーニングとカウント

twitter_data のうち、苦情と分類された航空会社のツイートだけを対象に、ストップワードを除去して内容を確認します。

指示

100 XP
  • twitter_data のツイートをトークン化し、トークン化した単語の列名を word にします。
  • トークン化した twitter_data からデフォルトのストップワードを除去します。
  • 苦情だけが残るようにフィルタします。
  • トークン化・クリーニング後のテキストで単語数を集計し、件数の降順で並べ替えます。