1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Bing tidy polarita: Jednoduchý příklad

Teď, když rozumíš základům inner join, pojďme to aplikovat na lexikon „Bing". Nezapomeň, že funkce inner_join() pochází z balíčku dplyr a lexikonový objekt získáš pomocí funkce get_sentiments() z balíčku tidytext.

Bing lexikon označuje slova jako pozitivní nebo negativní. Následující tři cvičení ti umožní pracovat přímo s tímto lexikonem. Aby funkce get_sentiments() stáhla konkrétní lexikon, předej jí řetězec jako "afinn", "bing", "nrc" nebo "loughran".

Postup s inner join:

  • Získej správný lexikon pomocí get_sentiments().
  • Předej lexikon a tidy textová data funkci inner_join().
  • Aby funkce inner_join() správně fungovala, musí existovat sdílený název sloupce. Pokud žádný sdílený název neexistuje, deklaruj ho pomocí dodatečného parametru by s hodnotou c obsahující názvy sloupců, jak je ukázáno níže.
object <- x %>% 
    inner_join(y, by = c("column_from_x" = "column_from_y"))
  • Proveď agregaci a analýzu nad průnikem tabulek.

Pokyny

100 XP

Načetli jsme ag_txt obsahující prvních 100 řádků z Agamemnona a ag_tidy, což je jeho tidy verze.

  • Pro srovnání spusť funkci polarity() na ag_txt.
  • Získej lexikon "bing" tak, že tento řetězec předáš funkci get_sentiments().
  • Proveď inner_join() s ag_tidy a bing.
    • Sloupce se slovy se jmenují "term" v ag_tidy a "word" v lexikonu, takže deklaruj argument by.
    • Nový objekt pojmenuj ag_bing_words.
  • Vypiš ag_bing_words a prohlédni si slova, která se ve výsledku objevila.
  • Předej ag_bing_words funkci count() se sloupcem sentiment pomocí operátoru pipe, %>%. Porovnej skóre z polarity() s poměrem počtu sentimentů.