1. Learn
  2. /
  3. Cursuri
  4. /
  5. Rで学ぶソーシャルメディアデータ分析

Connected

exercițiu

カスタムストップワードの除去

テキストコーパス内のよく使われる用語は、棒グラフやワードクラウドで可視化できます。

ただし、可視化ツールを使う前に、まずコーパスに含まれるカスタムストップワードを除去することが重要です。

この演習では、用語頻度を確認し、"telemedicine" 用に作成したテキストコーパスからカスタムストップワードを取り除きます。

テキストコーパスは twt_corpus としてあらかじめ読み込まれています。

この演習では、qdap と tm のライブラリが読み込まれています。

Instrucțiuni 1/2

undefined XP
    1
    2
  • twt_corpus から上位60語の用語頻度を抽出します。