1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSentiment Analysis

Connected

演習

Bing の tidy な極性判定:Call me Ishmael(ggplot2 付き)!

Bing 辞書を使う最後の演習です!この演習では、パイプ演算子(%>%)を使って、Moby Dick のセンチメントのタイムラインを作成します。 最後に、以下のコード構造に沿ってシンプルな可視化も作成します。ビジュアルについては、次の章でさらに詳しく扱います。

ggplot(pivoted_data, aes(index_column, polarity_column)) +
  geom_smooth(se = FALSE)

指示1 / 2

undefined XP
    1
    2
  • moby を bing 辞書と inner join します。
    • ティブルを結合するには inner_join() を呼び出します。
    • テキスト側の term 列と辞書側の word 列で結合します。
  • sentiment と index ごとに件数を数えます。
  • 各センチメントがそれぞれの列になるように形を変えます。
    • pivot_wider() を呼び出します。
    • 複数列に分割する基準となる names_from 列は sentiment です。
    • カウントを含む values_from 列は n です。
    • 欠損値を 0 で埋めるために values_fill = 0 も指定します。
  • mutate() を使って polarity 列を追加します。positive 列と negative 列の差として定義します。
  • 最後の %>% で確認する前に、行の順序付けには arrange を使います。