1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Zliczanie według produktu i zmiana kolejności

tidy_twitter został poddany tokenizacji, a stop słowa – w tym niestandardowe – zostały usunięte. Chcesz zwizualizować różnice w liczbie wystąpień słów w zależności od tego, czy dany wpis jest skargą, czy nie.

Instrukcje

100 XP
  • Zlicz słowa z podziałem na skargi i nie-skargi.
  • Zachowaj 20 najczęściej występujących słów w każdej z grup.
  • Przed zmianą kolejności słów jako czynnika według liczby wystąpień usuń grupowanie.