Dendrogram opmaken
Je hebt een dendrogram gemaakt… maar het valt minder op dan je had gehoopt!
Het dendextend-pakket kan je publiek helpen door takken te kleuren en clusters te omlijnen. dendextend is ontworpen om te werken met dendrogramobjecten, dus je moet de hiërarchische cluster van hclust omzetten met as.dendrogram().
Een goede manier om de termen in je dendrogram te bekijken is met de functie labels(). Die print alle termen van het dendrogram. Om specifieke takken te markeren, gebruik je branches_attr_by_labels(). Geef eerst het dendrogramobject door, daarna een vector met termen zoals c("data", "camp"). Voeg ten slotte een kleur toe, zoals "blue".
Nadat je je plot hebt gemaakt, kun je clusters benadrukken met rect.dendrogram(). Dit voegt rechthoeken toe voor elke cluster. Het eerste argument van rect.dendrogram() is het dendrogram, gevolgd door het aantal clusters (k). Je kunt ook een border-argument meegeven om aan te geven welke kleur je voor de rechthoeken wilt (bijv. "green").
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
Het dendextend-pakket is al voor je geladen en er is een hiërarchisch clusterobject hc gemaakt op basis van tweets_dist.
- Maak
hcdals een dendrogram metas.dendrogram()ophc. - Print de
labelsvanhcdnaar de console. - Gebruik
branches_attr_by_labels()om de takken te kleuren. Geef drie argumenten door: hethcd-object,c("marvin", "gaye"), en de kleur"red". Ken dit toe aanhcd_colored. plot()het dendrogramhcd_coloredmet de titel"Better Dendrogram", toegevoegd via het argumentmain.- Voeg rechthoeken toe aan de plot met
rect.dendrogram(). Specificeerk = 2clusters en eenborder-kleur van"grey50".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create hcd
___ <- ___(___)
# Print the labels in hcd
___(___)
# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)
# Plot hcd_colored
___(___, ___)
# Add cluster rectangles
___(___, ___, ___)