1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

แบบฝึกหัด

Prosta chmura słów

Dotarłeś już do tego miejsca, więc czas na nowe wyzwanie! Przygotuj się na analizę kolejnej partii 1000 tweetów. Na razie nie wiesz, co je łączy – sprawdź, czy uda ci się to odkryć za pomocą chmury słów. Wartości częstości terminów są już wczytane do twojego środowiska.

Chmura słów to wizualizacja terminów, w której rozmiar czcionki zazwyczaj odpowiada częstości danego słowa, a kolory mogą wskazywać dodatkowe informacje. Na razie trzymamy się prostoty: rozmiar odzwierciedla częstość poszczególnych słów, a my używamy tylko jednego koloru.

Jak pokazano w filmie, funkcja wordcloud() działa w następujący sposób:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Analizy text miningu często obejmują proste chmury słów. Są one może nieco nadużywane, ale wciąż stanowią przydatne narzędzie do szybkiego zrozumienia treści dużego zbioru tekstów!

term_frequency jest wczytane do twojego środowiska.

คำแนะนำ

100 XP
  • Wczytaj pakiet wordcloud.
  • Wyświetl pierwszych 10 elementów z term_frequency.
  • Wyodrębnij terminy, stosując names() na term_frequency. Nadaj wektorowi ciągów znaków nazwę terms_vec.
  • Utwórz wordcloud(), używając terms_vec jako słów i term_frequency jako wartości. Dodaj parametry max.words = 50 oraz colors = "red".