1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSentiment Analysis

Connected

演習

単語の影響度と頻度分析

データを探索する最も手軽な方法のひとつが頻度分析です。難しくはありませんが、感情分析ではこのシンプルな手法が驚くほど示唆的なことがあります。ここでは棒グラフを作成します。この演習では、可視化を作るために再び moby と bing を使います。

棒の順序を小さいものから大きいものへ並べるには、factor を使った小技を使います。reorder() は、別のスコア変数に基づいて factor の水準順を変更できます。今回は、スコア変数 polarity によって factor 変数 term の順序を並べ替えます。

指示1 / 3

undefined XP
    1
    2
    3
  • moby_tidy_sentiment を作成します。
    • count() を使い、term、sentiment、wt = count を指定します。
    • pivot_wider() にパイプし、names_from = sentiment、values_from = n、values_fill = 0 を指定します。
    • mutate() にパイプします。新しい変数名は polarity とし、positive から negative を引いた値で計算します。
  • moby_tidy_sentiment を呼び出して、前の演習と見比べて確認してください。