Aan de slagGa gratis aan de slag

Dendrogram opmaken

Je hebt een dendrogram gemaakt… maar het valt minder op dan je had gehoopt!

Het dendextend-pakket kan je publiek helpen door takken te kleuren en clusters te omlijnen. dendextend is ontworpen om te werken met dendrogramobjecten, dus je moet de hiërarchische cluster van hclust omzetten met as.dendrogram().

Een goede manier om de termen in je dendrogram te bekijken is met de functie labels(). Die print alle termen van het dendrogram. Om specifieke takken te markeren, gebruik je branches_attr_by_labels(). Geef eerst het dendrogramobject door, daarna een vector met termen zoals c("data", "camp"). Voeg ten slotte een kleur toe, zoals "blue".

Nadat je je plot hebt gemaakt, kun je clusters benadrukken met rect.dendrogram(). Dit voegt rechthoeken toe voor elke cluster. Het eerste argument van rect.dendrogram() is het dendrogram, gevolgd door het aantal clusters (k). Je kunt ook een border-argument meegeven om aan te geven welke kleur je voor de rechthoeken wilt (bijv. "green").

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Cursus bekijken

Oefeninstructies

Het dendextend-pakket is al voor je geladen en er is een hiërarchisch clusterobject hc gemaakt op basis van tweets_dist.

  • Maak hcd als een dendrogram met as.dendrogram() op hc.
  • Print de labels van hcd naar de console.
  • Gebruik branches_attr_by_labels() om de takken te kleuren. Geef drie argumenten door: het hcd-object, c("marvin", "gaye"), en de kleur "red". Ken dit toe aan hcd_colored.
  • plot() het dendrogram hcd_colored met de titel "Better Dendrogram", toegevoegd via het argument main.
  • Voeg rechthoeken toe aan de plot met rect.dendrogram(). Specificeer k = 2 clusters en een border-kleur van "grey50".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create hcd
___ <- ___(___)

# Print the labels in hcd
___(___)

# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)

# Plot hcd_colored
___(___, ___)

# Add cluster rectangles
___(___, ___, ___)
Code bewerken en uitvoeren