1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるテキスト分析

Connected

演習

製品別のカウントと並べ替え

tidy_twitter はすでにトークン化され、カスタムのストップワードを含むストップワードが除去されています。クレームかどうかによって語の出現数の違いを可視化したいとします。

指示

100 XP
  • クレームかどうかで語をカウントします。
  • クレームかどうかごとに上位20語のみを残します。
  • 語を因子としてカウントで並べ替える前に、グループ化を解除します。