Teaser: eenvoudige woordclustering
In het volgende hoofdstuk behandelen we enkele uiteenlopende (maar heel belangrijke) onderwerpen in text mining, waaronder:
- TDM/DTM-weging
- Omgaan met de schaarste van TDM/DTM
- Metadata vastleggen
- Eenvoudige woordclustering voor topics
- Analyse van meer dan één woord
Voor nu maken we simpelweg een nieuwe visual genaamd een dendrogram op basis van onze coffee_tweets. Het volgende hoofdstuk legt dit in detail uit.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
Een hiërarchisch clusterobject, hc, is voor je aangemaakt op basis van de coffee tweets.
Maak een dendrogram met plot() op hc.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot a dendrogram
___