1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Rychlá analýza základní polarity

Na začátku projektu analýzy sentimentu se někdy vyplatí rychle zavolat polarity() – pomůže ti nastavit očekávání a lépe pochopit povahu dat. V tomto cvičení (abychom ušetřili čas) aplikuješ polarity() na část vektoru comments, zatímco větší objekt polarity se načítá na pozadí.

Z grafu hustoty pravděpodobnosti si všimneš, že recenze se nesoustředí kolem 0. Za tímto „nafukováním skóre sentimentu" stojí obvykle dva důvody. Prvním jsou sociální normy – respondenti mívají tendenci vyjadřovat se spíše kladně než neutrálně. To se přirozeně liší podle kanálu. Kanály s ostřejším tónem, jako jsou e-sportové komunity nebo příspěvky na sociálních sítích, mohou naopak skóre stlačovat dolů. Každý kanál má prostě jiná očekávání. Druhým možným důvodem je „sentiment zaměřený na vlastnosti". V některých recenzích může autor napsat například: „postel byla pohodlná a příjemná, ale kuchyň byla špinavá a odporná." Sentiment takové recenze pokrývá více vlastností najednou, což může průměrné skóre zkreslit.

V následujícím cvičení toto „nafukování skóre" upravíš, ale nejdřív prozkoumej recenze beze změny.

Pokyny

100 XP
  • Vytvoř objekt practice_pol pomocí polarity() aplikované na prvních šest recenzí: bos_reviews$comments[1:6].
  • Prohlédni si vrácený objekt polarity zavoláním practice_pol.
  • Zavolej summary() na practice_pol$all$polarity – tím získáš celkovou polaritu pro všech 6 komentářů.
  • Načetli jsme také větší objekt polarity pro všech 1 000 komentářů. Tento nový objekt se jmenuje bos_pol. Teď aplikuj summary() na správný prvek seznamu, který vrátí všechna skóre polarity objektu bos_pol.
  • Ukázkový kód obsahuje sloupcový graf a graf hustoty pravděpodobnosti, které jsou téměř připravené k vykreslení. Musíš zadat datový rámec představující všechna skóre. Nápověda: v předchozím kroku je polarity sloupec tohoto datového rámce.