1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Smutne zakończenie? Polarność chronologiczna

Czasem warto śledzić wydźwięk emocjonalny tekstu w czasie. Na przykład podczas kampanii reklamowej można monitorować nastawienie do marki, by ocenić skuteczność działań. Kilka takich przykładów pojawiło się pod koniec poprzedniego rozdziału.

W tym ćwiczeniu przypomnisz sobie sposób analizowania wydźwięku w czasie na przykładzie powieści Moby Dick. Można się spodziewać, że radosne fragmenty książki zawierają więcej pozytywnych słów, a ciemne momenty i smutne zakończenia – więcej negatywnego języka. Poznasz też kilka trików, które sprawią, że szereg czasowy polarności będzie bardziej czytelny wizualnie.

Przypomnienie kroków:

  1. Połącz tekst z leksykonem po słowie za pomocą złączenia wewnętrznego.
  2. Policz sentymenty według wiersza.
  3. Przekształć dane tak, by każdy sentyment miał własną kolumnę.
  4. (W zależności od leksykonu) Oblicz polarność jako wynik pozytywny minus wynik negatywny.
  5. Narysuj szereg czasowy polarności.

To ćwiczenie powinno być znajome – rozszerza zadanie Bing tidy polarity: Call me Ishmael (with ggplot2)!.

Instrukcje 1/2

undefined XP
    1
    2
  • Użyj inner_join(), aby połączyć wstępnie wczytaną, uporzą dkowaną wersję Moby Dicka – moby – z leksykonem bing.
    • Złącz po kolumnie "term" w tekście i kolumnie "word" w leksykonie.
  • Policz wystąpienia według sentiment i index.
  • Przekształć dane tak, by każdy sentyment miał własną kolumnę, używając pivot_wider():
    • names_from = sentiment – nazwy kolumn z kolumny sentiment
    • values_from = n – wartości z kolumny n
    • values_fill = 0 – uzupełnia braki (NA) zerami
  • Za pomocą mutate() dodaj dwie kolumny: polarity i line_number.
    • Ustaw polarity jako wynik pozytywny minus wynik negatywny.
    • Ustaw line_number jako numer wiersza, używając funkcji row_number().