1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

Exercise

共通する単語を可視化する

chardonnay と coffee のツイートファイルで共通して使われている単語が入ったコーパスが用意できたので、まずコーパスをクリーンアップし、TermDocumentMatrix に変換し、その後に commonality.cloud() に備えて行列に変換します。

commonality.cloud() 関数は、この行列オブジェクトに加えて、プロットをカスタマイズするための max.words や colors などの追加引数を受け取ります。

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Instructions

100 XP
  • 事前定義された clean_corpus() 関数を all_corpus に適用して、all_clean を作成します。
  • all_clean から TermDocumentMatrix の all_tdm を作成します。
  • all_tdm を行列オブジェクトに変換して all_m を作成します。
  • all_m を使って、max.words = 100、colors = "steelblue1" を指定した commonality.cloud() を作成します。