LoslegenKostenlos loslegen

Dendrogramm-Feinschliff

Du hast also ein Dendrogramm erstellt … aber es ist nicht so auffällig, wie du gehofft hattest!

Das Paket dendextend kann deinem Publikum helfen, indem es Äste einfärbt und Cluster hervorhebt. dendextend ist für die Arbeit mit Dendrogramm-Objekten ausgelegt, daher musst du den hierarchischen Cluster aus hclust mit as.dendrogram() umwandeln.

Eine gute Möglichkeit, die Begriffe in deinem Dendrogramm zu überprüfen, ist die Funktion labels(). Sie gibt alle Terme des Dendrogramms aus. Um bestimmte Äste hervorzuheben, verwende branches_attr_by_labels(). Übergebe zuerst das Dendrogramm-Objekt, dann einen Vektor von Begriffen wie in c("data", "camp"). Zum Schluss füge eine Farbe wie "blue" hinzu.

Nachdem du deinen Plot erstellt hast, kannst du Cluster mit rect.dendrogram() kennzeichnen. Das fügt Rechtecke für jeden Cluster hinzu. Das erste Argument von rect.dendrogram() ist das Dendrogramm, gefolgt von der Anzahl der Cluster (k). Du kannst auch ein border-Argument übergeben, um die Farbe der Rechtecke festzulegen (z. B. "green").

Diese Übung ist Teil des Kurses

Text Mining mit Bag-of-Words in R

Kurs anzeigen

Anleitung zur Übung

Das Paket dendextend wurde für dich geladen, und ein hierarchisches Cluster-Objekt hc wurde aus tweets_dist erstellt.

  • Erstelle hcd als Dendrogramm, indem du as.dendrogram() auf hc anwendest.
  • Gib die labels von hcd in der Konsole aus.
  • Verwende branches_attr_by_labels(), um die Äste einzufärben. Übergebe drei Argumente: das Objekt hcd, c("marvin", "gaye") und die Farbe "red". Weise das Ergebnis hcd_colored zu.
  • plot() das Dendrogramm hcd_colored mit dem Titel "Better Dendrogram", hinzugefügt über das Argument main.
  • Füge dem Plot Rechtecke mit rect.dendrogram() hinzu. Gib k = 2 Cluster an und eine border-Farbe von "grey50".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create hcd
___ <- ___(___)

# Print the labels in hcd
___(___)

# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)

# Plot hcd_colored
___(___, ___)

# Add cluster rectangles
___(___, ___, ___)
Code bearbeiten und ausführen