1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶSentiment Analysis

Connected

Exercise

実際のテキストで極性を計算する

ここまでで、テキスト内のポジティブ/ネガティブな意図を評価するための基本要素を学びました。結果に自信を持てるよう、次のポイントを覚えておきましょう。

  • subjectivity lexicon は、感情やポジティブ/ネガティブな感情に関連づけられた単語のあらかじめ定義されたリストです。
  • 人間の表現は Zipf's law(ジップの法則)で説明できるため、主観語彙リストにすべての単語を網羅する必要はありません。

手早く始めるには、主観語彙リストを内蔵した polarity() 関数を使うのが便利です。

この関数はテキストを走査して、語彙リストに含まれる単語を特定します。次に、見つかった主観語の周囲にクラスターを作り、そのクラスター内で valence shifters(極性変調語)がスコアを調整します。極性変調語とは、主観語の感情的な意図を強めたり打ち消したりする語のことです。たとえば「well known」はポジティブですが、「not well known」はネガティブです。ここでは「not」が否定語で、「well known」の感情的意図を反転させます。対照的に「very well known」は増幅語を用いてポジティブな意図を強めます。

polarity() は、主観語、極性変調語、そして文章内の総単語数を用いてスコアを計算します。この演習では、シンプルな極性計算を体験します。次の動画では、polarity() の内部処理をさらに詳しく見ていきます。

Instructions 1/2

undefined XP
    1
    2

positive の polarity() を計算し、pos_score という新しいオブジェクトに代入します。呼び出し全体をカッコで囲んで、出力も表示されるようにしてください。