1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Porównanie analizy nastrojów Tidy z polaryzacją Qdap

Przekonasz się tutaj, że różne metody analizy nastrojów dają różne wyniki. Często wystarczy, że wyniki są zgodne co do kierunku, nawet jeśli szczegóły się różnią. W poprzednim ćwiczeniu utworzyłeś(-aś) tidy_reviews – ramkę danych zawierającą recenzje wynajmu bez stop słów. Wcześniej w tym rozdziale obliczyłeś(-aś) i zwizualizowałeś(-aś) wyniki podstawowej funkcji polarity() z pakietu qdap, która pokazała, że recenzje mają zazwyczaj pozytywny wydźwięk.

Teraz przeprowadzimy podobną analizę w stylu tidytext! Przypomnij sobie z wcześniejszego rozdziału: wykonasz inner_join(), następnie count(), a potem pivot_wider().

Na koniec utworzysz nową kolumnę za pomocą mutate(), przekazując wyrażenie positive - negative.

Instrukcje

100 XP
  • Użyj funkcji get_sentiments() z argumentem "bing", aby pobrać leksykon subiektywności bing. Przypisz leksykon do obiektu bing.
  • Ponieważ ten kod pisałeś(-aś) już w rozdziale 2, wystarczy, że wprowadzisz obiekt leksykonu bing, nazwę nowej kolumny (polarity) oraz jej obliczenie w funkcji mutate().
  • Na koniec wywołaj summary() na nowym obiekcie pos_neg. Mimo że wartości są różne, sprawdź średnią – czy większość recenzji wynajmu jest równie pozytywna jak w przypadku użycia polarity()? Czy zauważasz efekt „zawyżonych ocen"?