Een eenvoudige wordcloud
Op dit punt heb je te veel koffie op. Bovendien zijn de belangrijkste woorden zoals "shop", "morning" en "drinking" niet heel verhelderend.
Als viering dat je al zo ver bent gekomen, gaan we aan de slag met nog eens 1000 tweets. Voor nu weet je nog niet wat ze gemeen hebben, maar kijk of je dat kunt achterhalen met een wordcloud. De termfrequenties van de tweets zijn alvast in je werkruimte geladen.
Een wordcloud is een visualisatie van termen. In een wordcloud wordt de grootte vaak geschaald naar frequentie, en soms geven kleuren een andere maat weer. Voor nu houden we het simpel: grootte hangt samen met de frequentie van afzonderlijke woorden, en we kiezen één kleur.
Zoals je in de video zag, werkt de functie wordcloud() zo:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Tekstmining-analyses bevatten vaak eenvoudige wordclouds. Ze worden waarschijnlijk te vaak gebruikt, maar kunnen nog steeds nuttig zijn om snel inzicht te krijgen in een verzameling tekst!
term_frequency is geladen in je werkruimte.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
- Laad het package
wordcloud. - Print de eerste 10 items in
term_frequency. - Extraheer de termen met
names()opterm_frequency. Noem de vector met stringsterms_vec. - Maak een
wordcloud()metterms_vecals de woorden enterm_frequencyals de waarden. Voeg de parametersmax.words = 50encolors = "red"toe.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs