1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Šťastné písničky!

Samotná pozitivní a negativní slova samozřejmě nestačí. V tomto cvičení se seznámíš s tzv. valencovými posunovači, které prozradí více o emočním záměru autora. Dříve jsi funkci polarity() aplikoval/a na texty bez valencových posunovačů. Teď uvidíš v praxi slova zesilující i negační.

Připomeň si, že zesilující slovo přidá k pozitivnímu slovu v polarity() hodnotu 0,8, takže pozitivní skóre se zvýší na 1,8. U negativních slov se 0,8 odečte, takže výsledek bude -1,8. Skóre se pak vydělí odmocninou celkového počtu slov.

Podívej se na tento příklad od Franka Sinatry:

  • "It was a very good year"

„Good" má hodnotu 1 a „very" přidá dalších 0,8. Výsledek 1,8/sqrt(6) dává polaritu 0,73.

Negační slovo, například „not", obrátí skóre subjektivity. Podívej se na příklad od Bobbyho McFerrina:

  • "Don't worry Be Happy"

„worry" má díky negaci „don't" hodnotu 1. Přičtením „happy" (+1) dostaneme 2. Při 4 slovech celkem je výsledek 2 / sqrt(4), tedy polarita 1.

Pokyny

100 XP
  • Prozkoumej datový rámec conversation. Všimni si valencových posunovačů, jako je „never", ve sloupci text.
  • Aplikuj polarity() na sloupec text z conversation, abys vypočítal/a polaritu celého rozhovoru.
  • Vypočítej skóre polarity podle studenta a výsledek ulož do student_pol.
    • Zavolej polarity() znovu, tentokrát předej dva sloupce z conversation.
    • Textová proměnná je text, skupinová proměnná je student.
  • Výsledky na úrovni studentů zobrazíš pomocí scores() aplikovaného na student_pol.
  • Funkce counts() aplikovaná na student_pol vypíše polaritu na úrovni vět pro celý datový rámec spolu s identifikovanými slovy z lexikonu.
  • Objekt polarity student_pol můžeš vizualizovat pomocí plot().