Een eenvoudige wordcloud

Op dit punt heb je te veel koffie op. Bovendien zijn de belangrijkste woorden zoals "shop", "morning" en "drinking" niet heel verhelderend.

Als viering dat je al zo ver bent gekomen, gaan we aan de slag met nog eens 1000 tweets. Voor nu weet je nog niet wat ze gemeen hebben, maar kijk of je dat kunt achterhalen met een wordcloud. De termfrequenties van de tweets zijn alvast in je werkruimte geladen.

Een wordcloud is een visualisatie van termen. In een wordcloud wordt de grootte vaak geschaald naar frequentie, en soms geven kleuren een andere maat weer. Voor nu houden we het simpel: grootte hangt samen met de frequentie van afzonderlijke woorden, en we kiezen één kleur.

Zoals je in de video zag, werkt de functie wordcloud() zo:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Tekstmining-analyses bevatten vaak eenvoudige wordclouds. Ze worden waarschijnlijk te vaak gebruikt, maar kunnen nog steeds nuttig zijn om snel inzicht te krijgen in een verzameling tekst!

term_frequency is geladen in je werkruimte.

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Bekijk cursus

Oefeninstructies

Laad het package wordcloud.
Print de eerste 10 items in term_frequency.
Extraheer de termen met names() op term_frequency. Noem de vector met strings terms_vec.
Maak een wordcloud() met terms_vec als de woorden en term_frequency als de waarden. Voeg de parameters max.words = 50 en colors = "red" toe.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs

Code bewerken en uitvoeren