1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶソーシャルメディアデータ分析

Connected

演習

カスタムストップワードの除去

テキストコーパス内のよく使われる用語は、棒グラフやワードクラウドで可視化できます。

ただし、可視化ツールを使う前に、まずコーパスに含まれるカスタムストップワードを除去することが重要です。

この演習では、用語頻度を確認し、"telemedicine" 用に作成したテキストコーパスからカスタムストップワードを取り除きます。

テキストコーパスは twt_corpus としてあらかじめ読み込まれています。

この演習では、qdap と tm のライブラリが読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • twt_corpus から上位60語の用語頻度を抽出します。