Aan de slagGa gratis aan de slag

Maak de betere wordcloud

Nu je extra stopwoorden hebt verwijderd, kunnen we de verbeterde wordcloud bekijken!

De term-documentmatrix uit de vorige oefening is omgezet naar een matrix met as.matrix(), waarna met rowSums() een benoemde vector is gemaakt. Dit nieuwe object met termfrequenties, chardonnay_words, is alvast in je werkruimte geladen. Laten we deze nieuwe wordcloud-resultaten bekijken.

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Cursus bekijken

Oefeninstructies

We hebben het pakket wordcloud alvast voor je geladen en doen dat ook voor alle volgende oefeningen die het nodig hebben.

  • Sorteer de waarden in chardonnay_words met decreasing = TRUE. Sla op als sorted_chardonnay_words.
  • Bekijk de bovenste 6 woorden in sorted_chardonnay_words en hun waarden.
  • Maak terms_vec met names() op chardonnay_words.
  • Geef terms_vec en chardonnay_words door aan de functie wordcloud(). Bekijk welke andere woorden nu opvallen nu "chardonnay" is verwijderd.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Sort the chardonnay_words in descending order
___ <- ___(___, ___)

# Print the 6 most frequent chardonnay terms
___(___)

# Get a terms vector
___ <- ___(___)

# Create a wordcloud for the values in word_freqs
wordcloud(___, ___, 
          max.words = 50, colors = "red")
Code bewerken en uitvoeren