1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

ćwiczenie

Wizualizacja wspólnych słów

Masz już korpus wypełniony słowami z plików tweetów o chardonnay i kawie – czas go wyczyścić, przekształcić w TermDocumentMatrix, a następnie w macierz, aby przygotować dane dla funkcji commonality.cloud().

Funkcja commonality.cloud() przyjmuje ten obiekt macierzy oraz dodatkowe argumenty, takie jak max.words i colors, które pozwalają dostosować wygląd wykresu.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Instrukcje

100 XP
  • Utwórz all_clean, stosując predefiniowaną funkcję clean_corpus() do all_corpus.
  • Utwórz all_tdm – obiekt TermDocumentMatrix na podstawie all_clean.
  • Utwórz all_m, konwertując all_tdm na obiekt macierzy.
  • Utwórz chmurę słów commonality.cloud() na podstawie all_m, ustawiając max.words = 100 i colors = "steelblue1".