1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

ćwiczenie

Stwórz ulepszoną chmurę słów

Teraz, gdy usunięto dodatkowe słowa stopu, czas przyjrzeć się ulepszonej chmurze słów!

Macierz termin–dokument z poprzedniego ćwiczenia została przekształcona w macierz za pomocą as.matrix(), a następnie utworzono nazwany wektor przy użyciu rowSums(). Nowy obiekt z częstościami terminów o nazwie chardonnay_words jest już wczytany do twojego środowiska. Sprawdź, jak wyglądają nowe wyniki chmury słów.

Instrukcje

100 XP

Pakiet wordcloud jest załadowany w tle – będzie tak również we wszystkich kolejnych ćwiczeniach, które go wymagają.

  • Posortuj wartości w chardonnay_words z parametrem decreasing = TRUE. Zapisz wynik jako sorted_chardonnay_words.
  • Sprawdź 6 najczęstszych słów w sorted_chardonnay_words wraz z ich wartościami.
  • Utwórz terms_vec, stosując names() na chardonnay_words.
  • Przekaż terms_vec i chardonnay_words do funkcji wordcloud(). Zwróć uwagę, jakie słowa wysuwają się na pierwszy plan po usunięciu słowa "chardonnay".