IniziaInizia gratis

Estetica del dendrogramma

Dunque, hai creato un dendrogramma… ma non è così accattivante come speravi!

Il pacchetto dendextend può aiutare il tuo pubblico colorando i rami e delineando i cluster. dendextend è pensato per operare su oggetti dendrogramma, quindi dovrai convertire il cluster gerarchico da hclust usando as.dendrogram().

Un buon modo per rivedere i termini nel tuo dendrogramma è con la funzione labels(). Stampa tutti i termini del dendrogramma. Per mettere in evidenza rami specifici, usa branches_attr_by_labels(). Per prima cosa, passa l'oggetto dendrogramma, poi un vettore di termini come in c("data", "camp"). Infine, aggiungi un colore come "blue".

Dopo aver creato il grafico, puoi evidenziare i cluster con rect.dendrogram(). Questo aggiunge dei rettangoli per ciascun cluster. Il primo argomento di rect.dendrogram() è il dendrogramma, seguito dal numero di cluster (k). Puoi anche passare un argomento border per specificare il colore che vuoi per i rettangoli (ad es. "green").

Questo esercizio fa parte del corso

Text mining con Bag-of-Words in R

Visualizza il corso

Istruzioni dell'esercizio

Il pacchetto dendextend è già stato caricato per te e un oggetto di clustering gerarchico, hc, è stato creato a partire da tweets_dist.

  • Crea hcd come dendrogramma usando as.dendrogram() su hc.
  • Stampa in console le labels di hcd.
  • Usa branches_attr_by_labels() per colorare i rami. Passagli tre argomenti: l'oggetto hcd, c("marvin", "gaye") e il colore "red". Assegna il risultato a hcd_colored.
  • Esegui plot() del dendrogramma hcd_colored con il titolo "Better Dendrogram", aggiunto usando l'argomento main.
  • Aggiungi rettangoli al grafico usando rect.dendrogram(). Specifica k = 2 cluster e un colore di border pari a "grey50".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create hcd
___ <- ___(___)

# Print the labels in hcd
___(___)

# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)

# Plot hcd_colored
___(___, ___)

# Add cluster rectangles
___(___, ___, ___)
Modifica ed esegui il codice