1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

ćwiczenie

Starcie tytanów, część 2! Negatywne opinie

W obu firmach pracownicy wymieniali „kulturę" i „zdolnych ludzi", co wskazuje na pewne wspólne pozytywne aspekty środowiska pracy. Jednak wykres piramidowy pozwala dostrzec różnice w natężeniu tych pozytywnych cech.

Teraz kierujesz uwagę na negatywne opinie i tworzysz analogiczną wizualizację. Ramka danych common_words jest już dostępna w twoim środowisku. Tym razem wspólne bigramy pochodzą z negatywnych opinii pracowników.

Instrukcje

100 XP
  • Używając slice_max() na common_words, pobierz 5 najczęstszych bigramów według kolumny diff. Wyniki nowego obiektu zostaną wyświetlone w konsoli.
  • Utwórz wykres pyramid.plot(). Przekaż top5_df$AmazonNeg, top5_df$GoogleNeg oraz labels = top5_df$terms. Aby poprawić etykiety, ustaw:
    • gap na 12.
    • top.labels na c("Amzn", "Neg Words", "Goog")

Argumenty main i unit są już ustawione.