1. Learn
  2. /
  3. Курси
  4. /
  5. Sentiment Analysis in R

Connected

вправа

Porovnání Tidy sentimentu s Qdap polaritou

V tomto cvičení zjistíš, že různé metody analýzy sentimentu mohou přinést různé výsledky. Většinou stačí, aby si výsledky odpovídaly ve svém směru, i když konkrétní hodnoty se mohou lišit. V předchozím cvičení jsi vytvořil/a tidy_reviews — datový rámec recenzí ubytování bez stopwords. Dříve v kapitole jsi vypočítal/a a vizualizoval/a základní funkci polarity() z balíčku qdap, která ukázala, že recenze mají tendenci být pozitivní.

Teď proveďme podobnou analýzu pomocí tidytext! Vzpomeň si z dřívější kapitoly: použiješ inner_join(), pak count() a nakonec pivot_wider().

Na závěr vytvoříš nový sloupec pomocí mutate() s výrazem positive - negative.

Інструкції

100 XP
  • Pomocí funkce get_sentiments() s argumentem "bing" získáš bing subjektivní lexikon. Pojmenuj lexikon bing.
  • Tento kód jsi už psal/a v kapitole 2 — stačí doplnit objekt lexikonu bing, název nového sloupce (polarity) a jeho výpočet do mutate().
  • Nakonec zavolej summary() na nový objekt pos_neg. I když se hodnoty liší, jsou recenze ubytování po pohledu na průměr podobně pozitivní jako při použití polarity()? Vidíš tam „grade inflation"?