1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Rovnou do toho! Vizualizace polarity

Analýza sentimentu ti pomůže zjistit, jaké pocity autor vyjadřuje k danému tématu. Toto cvičení ti ukáže, co tě v kurzu čeká!

Připravili jsme text_df reprezentující konverzaci se sloupci person a text.

Použij funkci polarity() z balíčku qdap pro ohodnocení text_df. Funkce polarity() přijímá jeden textový objekt nebo datový rámec s proměnnou pro seskupování a vypočítá kladné nebo záporné skóre.

V tomto příkladu použiješ operátor dolárového potrubí %$% z balíčku magrittr. Znak dolaru předá datový rámec do funkce polarity() a ty pak určíš název textového sloupce nebo textový sloupec spolu se seskupovací proměnnou — bez uvozovek.

text_data_frame %$% polarity(text_column_name)

Pro vytvoření objektu pomocí operátoru dolárového znaku:

polarity_object <- text_data_frame %$% 
  polarity(text_column_name, grouping_column_name)

Pro kvantitativní hodnocení sentimentu textu je potřeba přiřadit mu skóre. Jednoduchý přístup spočívá v přiřazení kladné nebo záporné hodnoty větě, pasáži nebo sbírce dokumentů zvané korpus. Hodnocení pouze pomocí kladných a záporných hodnot se nazývá „polarita". Pro extrakci skóre polarity se hodí funkce counts() aplikovaná na objekt polarity. Pro rychlou vizualizaci zavolej plot() na výsledek funkce polarity().

Pokyny

100 XP
  • Prohlédni si datový rámec text_df s konverzací.
  • Pomocí %$% předej text_df do polarity() spolu s názvem sloupce text bez uvozovek. Tím se vypíše polarita pro veškerý text.
  • Vytvoř nový objekt datacamp_conversation tak, že předáš text_df pomocí %$% do polarity(). Předej text a jako seskupovací sloupec přidej person. Tím se polarita vypočítá zvlášť pro každou osobu. Protože je vše uvnitř závorek, výsledek se zároveň vypíše.
  • Aplikuj counts() na datacamp_conversation, abys vypsal/a konkrétní emoční slova, která byla nalezena.
  • Vykresli datacamp_conversation pomocí plot().