1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Polaryzacja tidy z leksykonem Bing: prosty przykład

Skoro rozumiesz już podstawy złączenia wewnętrznego, zastosujmy je do leksykonu „Bing". Pamiętaj, że funkcja inner_join() pochodzi z pakietu dplyr, a obiekt leksykonu pobiera się za pomocą funkcji get_sentiments() z pakietu tidytext.

Leksykon Bing przypisuje słowom etykiety pozytywne lub negatywne. Kolejne trzy ćwiczenia pozwolą ci lepiej poznać ten konkretny leksykon. Aby skorzystać z get_sentiments(), przekaż do niej ciąg znaków: "afinn", "bing", "nrc" lub "loughran", aby pobrać wybrany leksykon.

Przebieg pracy ze złączeniem wewnętrznym:

  • Pobierz odpowiedni leksykon za pomocą get_sentiments().
  • Przekaż leksykon i uporządkowane dane tekstowe do inner_join().
  • Aby inner_join() działało poprawnie, musi istnieć wspólna nazwa kolumny. Jeśli takie kolumny nie istnieją, zadeklaruj je za pomocą dodatkowego parametru by równego c z nazwami kolumn jak poniżej.
object <- x %>% 
    inner_join(y, by = c("column_from_x" = "column_from_y"))
  • Przeprowadź agregację i analizę na przecięciu tabel.

Instrukcje

100 XP

Wczytaliśmy ag_txt zawierający pierwsze 100 wierszy z Agamemnona oraz ag_tidy – jego uporządkowaną wersję.

  • Dla porównania użyj polarity() na ag_txt.
  • Pobierz leksykon "bing", przekazując ten ciąg znaków do get_sentiments().
  • Wykonaj inner_join() z ag_tidy i bing.
    • Kolumny ze słowami nazywają się "term" w ag_tidy i "word" w leksykonie, dlatego zadeklaruj argument by.
    • Nowy obiekt nazwij ag_bing_words.
  • Wyświetl ag_bing_words i przejrzyj część słów, które znalazły się w wyniku.
  • Przekaż ag_bing_words do count() dla sentiment za pomocą operatora potoku %>%. Porównaj wynik polarity() ze stosunkiem liczby sentymentów.