1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Emocionální introspekce

V tomto cvičení jdeš za hranice rozdělování textu na pozitivní a negativní jazyk. Místo toho rozdělíš text podle každé z 8 emocí z Plutchikova kola emocí a vytvoříš vizualizaci. Tento přístup ti poskytne větší přehled o použití slov, protože je mapuješ na konkrétní emoci, nikoli jen na pozitivní nebo negativní hodnocení.

Pomocí subjektivitního lexikonu tidytext, konkrétně „nrc", provedeš inner_join() se svým textem. Lexikon „nrc" obsahuje 8 emocí plus třídy termínů pro pozitivní a negativní výrazy. Po provedení inner_join() proto budeš muset pozitivní a negativní slova odstranit. Jedním ze způsobů je použití negace ! spolu s funkcí grepl().

Funkce grepl() ("Global Regular Expression Print Logical") vrátí hodnotu True nebo False podle toho, zda byl daný vzor nalezen v každém řádku. V tomto cvičení budeš hledat pozitivní NEBO negativní výrazy pomocí operátoru |, který představuje „nebo", jak ukazuje příklad níže. Tento svislý znak se na klávesnici obvykle nachází nad klávesou Enter. Protože negace ! předchází funkci grepl(), hodnoty T a F se prohodí, takže výrazy "positive|negative" budou odstraněny, nikoli ponechány.

Object <- tibble %>%
  filter(!grepl("positive|negative", column_name))

Následně použiješ count() na identifikovaná slova spolu s pivot_wider() pro uspořádání datového rámce.

comparison.cloud() vyžaduje, aby vstupní data měla názvy řádků, takže je budeš muset převést na základní R data.frame zavoláním data.frame() s argumentem row.names.

Pokyny 1/2

undefined XP
    1
    2
  • Spoj inner_join() moby s nrc.
  • Pomocí filter() s negací (!) a grepl() vyhledej "positive|negative". Prohledávaný sloupec se jmenuje sentiment.
  • Pomocí count() spočítej výskyty podle sentiment a term.
  • Přetvoř datový rámec pomocí pivot_wider() s argumenty names_from = sentiment, values_from = n a values_fill = 0.
  • Převeď na základní datový rámec pomocí data.frame() a sloupec term použij jako názvy řádků.
  • Prohlédni si moby_tidy pomocí head().