1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSentiment Analysis

Connected

演習

著者の労力を評価する

著者は、より情熱的なときに言葉数が増えることがあります。たとえば、腹を立てた航空会社の乗客は、(自分の感じた)サービスが悪いほど長いレビューを残しがちです。反対に、熱量の低い乗客は、時間をかけてレビューを書く必要性をあまり感じないかもしれません。レビューが長くなるほど、ポジティブまたはネガティブな表現が必然的に増えるため、全体のセンチメントが膨らんで見える可能性があります。このコーディング演習では、労力とセンチメントを検討します。

この演習では、労力とセンチメントの関係を可視化します。レンタル物件のレビューを格納した tibble には id があり、各行が1語を表していることを思い出してください。つまり、id に対してシンプルに count() を行えば、各レビューで使われた単語数を取得できます。次に、この集計結果をポジティブ・ネガティブのデータに結合します。最終的に、レビューの長さと極性の関係を可視化する散布図を作成します。

指示1 / 2

undefined XP
    1
    2
  • 労力の指標として、id の件数を数えます。
  • 各レビューの極性 pos_neg に対して inner join します。
  • pol 列を追加するように mutate します。ifelse() を使って、polarity が 0 以上なら "Positive"、それ以外は "Negative" を設定します。