1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSentiment Analysis

Connected

演習

LOL, this song is wicked good

Zipfの法則を踏まえても、テキストの出所(例:twitter と法律文書)や書き手の属性(例:10代と高齢者)に合わせて辞書(レキシコン)を調整する必要があります。この演習では、必要に応じて変更できるように、polarity() の明示的な構成要素を確かめます。

Trey Songz の "Lol :)" という曲には "LOL smiley face, LOL smiley face." という歌詞があります。基本の polarity() では「LOL」はポジティブとして定義されていません。しかし「LOL」は「Laugh Out Loud(声を出して笑う)」の略で、本来はポジティブです。つまり、ポップカルチャーのスラングを含む文脈に合わせてレキシコンを調整すべきです。特定のチャネル(Twitter の「LOL」)、地域(ボストンの「Wicked Good」)、年齢層(10代の「sick」)などのテキストを分析する場合は、レキシコンの調整が必要になる可能性が高いです。

この演習では、主観性レキシコンや、極性を変化させる語を含む qdap の辞書自体は調整しません。代わりに、次の演習で変更できるよう、既存の語のデータフレームオブジェクトを確認します。

演習用に、Beyoncé の "Crazy in Love" の歌詞から2つの抜粋を含む text を用意しました。

指示1 / 2

undefined XP
    1
    2
  • 主観性の単語と値の一部を確認するため、key.pol を表示します。
  • 定義済みの negation.words を確認し、否定語をすべて表示します。
  • 次に、レキシコンの値を増幅する語を確認するため、amplification.words を表示します。
  • レキシコンの値を弱める語を確認するため、deamplification.words を表示します。
  • 会話を確認するため、text を呼び出します。