1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

LOL, tenhle song je šíleně dobrý

I přes Zipfův zákon budeš muset lexikony přizpůsobovat konkrétnímu zdroji textu (například Twitter versus právní dokumenty) nebo demografii autora (teenager versus senior). Toto cvičení ti ukáže jednotlivé explicitní komponenty funkce polarity(), abys je mohl/a podle potřeby upravit.

V písni „Lol :)" od Treyho Songze se vyskytuje text: „LOL smiley face, LOL smiley face." Základní funkce polarity() výraz „LOL" jako pozitivní nevyhodnocuje. Přitom „LOL" je zkratka pro „Laugh Out Loud" (česky: nahlas se smát) a měl by mít pozitivní hodnotu. Proto je potřeba lexikon přizpůsobit kontextu textu, který obsahuje popkulturní slang. Pokud tvoje analýza pracuje s textem z konkrétního kanálu (například „LOL" na Twitteru), místa (bostonské „Wicked Good") nebo věkové skupiny (teenagerské „sick"), pravděpodobně budeš muset lexikon upravit.

V tomto cvičení lexikon subjektivity ani slovníky s přechodovými výrazy z balíčku qdap ještě neupravuješ. Místo toho si prohlídneš stávající datové rámce se slovy, abys je mohl/a upravit v následujícím cvičení.

Proměnná text obsahuje dva úryvky z textu písně „Crazy in Love" od Beyoncé.

Pokyny 1/2

undefined XP
    1
    2
  • Vypiš key.pol a zobraz část slov a hodnot ze slovníku subjektivity.
  • Prohlédni si předdefinovaný objekt negation.words a vypiš všechny negující výrazy.
  • Vypiš amplification.words a zobraz slova, která hodnoty v lexikonu zesilují.
  • Prohlédni si deamplification.words a vypiš slova, která hodnoty v lexikonu zeslabují.
  • Zavolej text a zobraz konverzaci.