Maak de betere wordcloud
Nu je extra stopwoorden hebt verwijderd, kunnen we de verbeterde wordcloud bekijken!
De term-documentmatrix uit de vorige oefening is omgezet naar een matrix met as.matrix(), waarna met rowSums() een benoemde vector is gemaakt. Dit nieuwe object met termfrequenties, chardonnay_words, is alvast in je werkruimte geladen. Laten we deze nieuwe wordcloud-resultaten bekijken.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
We hebben het pakket wordcloud alvast voor je geladen en doen dat ook voor alle volgende oefeningen die het nodig hebben.
- Sorteer de waarden in
chardonnay_wordsmetdecreasing = TRUE. Sla op alssorted_chardonnay_words. - Bekijk de bovenste 6 woorden in
sorted_chardonnay_wordsen hun waarden. - Maak
terms_vecmetnames()opchardonnay_words. - Geef
terms_vecenchardonnay_wordsdoor aan de functiewordcloud(). Bekijk welke andere woorden nu opvallen nu "chardonnay" is verwijderd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Sort the chardonnay_words in descending order
___ <- ___(___, ___)
# Print the 6 most frequent chardonnay terms
___(___)
# Get a terms vector
___ <- ___(___)
# Create a wordcloud for the values in word_freqs
wordcloud(___, ___,
max.words = 50, colors = "red")