1. 학습
  2. /
  3. 강의
  4. /
  5. Analiza sentymentu w R

Connected

연습 문제

Skocz na głęboką wodę! Wizualizacja polaryzacji

Analiza sentymentu pozwala wyodrębnić stosunek autora do danego tematu. To ćwiczenie da ci przedsmak tego, co czeka cię w kursie!

Przygotowaliśmy ramkę danych text_df reprezentującą rozmowę – zawiera kolumny person i text.

Użyj funkcji polarity() z pakietu qdap, aby nadać text_df ocenę sentymentu. Funkcja polarity() przyjmuje pojedynczy obiekt znakowy lub ramkę danych ze zmienną grupującą i oblicza wynik pozytywny lub negatywny.

W tym przykładzie skorzystasz z operatora potoku dolarowego %$% z pakietu magrittr. Znak dolara przekazuje ramkę danych do polarity(), a nazwy kolumny tekstowej lub kolumny tekstowej i zmiennej grupującej podajesz bez cudzysłowów.

text_data_frame %$% polarity(text_column_name)

Aby zapisać wynik do obiektu za pomocą operatora ze znakiem dolara:

polarity_object <- text_data_frame %$% 
  polarity(text_column_name, grouping_column_name)

Aby ilościowo ocenić sentyment tekstu, trzeba przypisać mu wynik. Prosta metoda polega na nadaniu zdaniu, fragmentowi lub zbiorowi dokumentów (zwanemu korpusem) wartości dodatniej lub ujemnej. Ocenianie wyłącznie wartościami pozytywnymi lub negatywnymi nazywa się „polaryzacją". Przydatną funkcją do wyodrębniania wyników polaryzacji jest counts() zastosowana do obiektu polaryzacji. Aby szybko zwizualizować wyniki, wywołaj plot() na wyniku polarity().

지침

100 XP
  • Zbadaj ramkę danych text_df z rozmową.
  • Używając %$%, przekaż text_df do polarity() wraz z nazwą kolumny text bez cudzysłowów. Spowoduje to wyświetlenie polaryzacji dla całego tekstu.
  • Utwórz nowy obiekt datacamp_conversation, przekazując text_df przez %$% do polarity(). Podaj text, a następnie kolumnę grupującą person. Spowoduje to obliczenie polaryzacji dla każdej osoby osobno. Ponieważ całość znajduje się w nawiasach, wynik zostanie również wyświetlony.
  • Zastosuj counts() do datacamp_conversation, aby wyświetlić konkretne słowa nacechowane emocjonalnie, które zostały znalezione.
  • Wywołaj plot() na datacamp_conversation.