1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Czarnoksiężnik z krainy NRC

Na koniec przyjrzysz się leksykonowi NRC, który przypisuje słowom etykiety wielu różnych stanów emocjonalnych. Pamiętasz koło emocji Plutchika? Leksykon NRC taguje słowa zgodnie z 8 emocjami Plutchika oraz kategoriami pozytywne/negatywne.

W tym ćwiczeniu pojawi się nowy operator, %in%, który sprawdza, czy elementy jednego wektora występują w drugim. W poniższym kodzie %in% zwróci FALSE, FALSE, TRUE – ponieważ wartości 1 i 2 z some_vec nie występują w some_other_vector, natomiast 3 występuje i zwraca TRUE. Operator %in% przydaje się do wyszukiwania dopasowań.

some_vec <- c(1, 2, 3)
some_other_vector <- c(3, "a", "b")
some_vec %in% some_other_vector

Kolejnym nowym operatorem jest !. Dodanie ! przed warunkiem logicznym odwraca jego wynik. W powyższym przykładzie FALSE, FALSE, TRUE zmieni się w TRUE, TRUE, FALSE. Użyty razem z %in% pozwala wykluczyć dopasowane elementy.

!some_vec %in% some_other_vector

Przygotowaliśmy obiekt oz – uporzą dkowaną wersję Czarnoksiężnika z Oz – oraz nrc zawierający leksykon "NRC" z przemianowanymi kolumnami.

Instrukcje 1/2

undefined XP
    1
    2
  • Wykonaj inner join, łącząc oz z leksykonem nrc.
    • Wywołaj inner_join(), aby połączyć tibble.
    • Połącz by kolumnę term z tekstu z kolumną word z leksykonu.
  • Odfiltruj wyniki tak, by zostały tylko emocje Plutchika – usuń słowa oznaczone jako pozytywne lub negatywne.
    • Użyj filter(), aby zachować wiersze, w których sentiment nie jest równy "positive" ani "negative".
  • Pogrupuj dane według sentymentu.
    • Wywołaj group_by(), przekazując sentiment bez cudzysłowów.
  • Oblicz łączną liczbę wystąpień każdego sentymentu.
    • Wywołaj summarize(), ustawiając total_count równe sum() z count.
    • Przypisz wynik do oz_plutchik.