Dendrogramm-Feinschliff
Du hast also ein Dendrogramm erstellt … aber es ist nicht so auffällig, wie du gehofft hattest!
Das Paket dendextend kann deinem Publikum helfen, indem es Äste einfärbt und Cluster hervorhebt. dendextend ist für die Arbeit mit Dendrogramm-Objekten ausgelegt, daher musst du den hierarchischen Cluster aus hclust mit as.dendrogram() umwandeln.
Eine gute Möglichkeit, die Begriffe in deinem Dendrogramm zu überprüfen, ist die Funktion labels(). Sie gibt alle Terme des Dendrogramms aus. Um bestimmte Äste hervorzuheben, verwende branches_attr_by_labels(). Übergebe zuerst das Dendrogramm-Objekt, dann einen Vektor von Begriffen wie in c("data", "camp"). Zum Schluss füge eine Farbe wie "blue" hinzu.
Nachdem du deinen Plot erstellt hast, kannst du Cluster mit rect.dendrogram() kennzeichnen. Das fügt Rechtecke für jeden Cluster hinzu. Das erste Argument von rect.dendrogram() ist das Dendrogramm, gefolgt von der Anzahl der Cluster (k). Du kannst auch ein border-Argument übergeben, um die Farbe der Rechtecke festzulegen (z. B. "green").
Diese Übung ist Teil des Kurses
Text Mining mit Bag-of-Words in R
Anleitung zur Übung
Das Paket dendextend wurde für dich geladen, und ein hierarchisches Cluster-Objekt hc wurde aus tweets_dist erstellt.
- Erstelle
hcdals Dendrogramm, indem duas.dendrogram()aufhcanwendest. - Gib die
labelsvonhcdin der Konsole aus. - Verwende
branches_attr_by_labels(), um die Äste einzufärben. Übergebe drei Argumente: das Objekthcd,c("marvin", "gaye")und die Farbe"red". Weise das Ergebnishcd_coloredzu. plot()das Dendrogrammhcd_coloredmit dem Titel"Better Dendrogram", hinzugefügt über das Argumentmain.- Füge dem Plot Rechtecke mit
rect.dendrogram()hinzu. Gibk = 2Cluster an und eineborder-Farbe von"grey50".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create hcd
___ <- ___(___)
# Print the labels in hcd
___(___)
# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)
# Plot hcd_colored
___(___, ___)
# Add cluster rectangles
___(___, ___, ___)