1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dolování textu metodou Bag-of-Words v R

Connected

Cvičení

Vykresli vylepšený word cloud

Teď, když jsi odstranil/a další stopslova, pojďme se podívat na vylepšený word cloud!

Matice termínů a dokumentů z předchozího cvičení byla převedena na matici pomocí as.matrix() a následně byl pomocí rowSums() vytvořen pojmenovaný vektor. Tento nový objekt s frekvencemi termínů se jmenuje chardonnay_words a je předem načtený v tvém pracovním prostředí. Podíváme se na výsledky nového word cloudu.

Pokyny

100 XP

Balíček wordcloud jsme za tebe načetli na pozadí — totéž uděláme ve všech dalších cvičeních, která ho vyžadují.

  • Seřaď hodnoty v chardonnay_words pomocí decreasing = TRUE. Výsledek ulož jako sorted_chardonnay_words.
  • Podívej se na 6 nejčastějších slov v sorted_chardonnay_words a jejich hodnoty.
  • Vytvoř terms_vec pomocí names() aplikovaného na chardonnay_words.
  • Předej terms_vec a chardonnay_words do funkce wordcloud(). Prohlédni si, která další slova teď vyniknou, když je „chardonnay" odstraněno.