Teaser: eenvoudige woordclustering
In het volgende hoofdstuk behandelen we enkele uiteenlopende (maar heel belangrijke) onderwerpen in text mining, waaronder:
- TDM/DTM-weging
- Omgaan met de schaarste van TDM/DTM
- Metadata vastleggen
- Eenvoudige woordclustering voor topics
- Analyse van meer dan één woord
Voor nu maken we simpelweg een nieuwe visual genaamd een dendrogram op basis van onze coffee_tweets. Het volgende hoofdstuk legt dit in detail uit.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
Een hiërarchisch clusterobject, hc, is voor je aangemaakt op basis van de coffee tweets.
Maak een dendrogram met plot() op hc.
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Plot a dendrogram
___