Estetica del dendrogramma
Dunque, hai creato un dendrogramma… ma non è così accattivante come speravi!
Il pacchetto dendextend può aiutare il tuo pubblico colorando i rami e delineando i cluster. dendextend è pensato per operare su oggetti dendrogramma, quindi dovrai convertire il cluster gerarchico da hclust usando as.dendrogram().
Un buon modo per rivedere i termini nel tuo dendrogramma è con la funzione labels(). Stampa tutti i termini del dendrogramma. Per mettere in evidenza rami specifici, usa branches_attr_by_labels(). Per prima cosa, passa l'oggetto dendrogramma, poi un vettore di termini come in c("data", "camp"). Infine, aggiungi un colore come "blue".
Dopo aver creato il grafico, puoi evidenziare i cluster con rect.dendrogram(). Questo aggiunge dei rettangoli per ciascun cluster. Il primo argomento di rect.dendrogram() è il dendrogramma, seguito dal numero di cluster (k). Puoi anche passare un argomento border per specificare il colore che vuoi per i rettangoli (ad es. "green").
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
Il pacchetto dendextend è già stato caricato per te e un oggetto di clustering gerarchico, hc, è stato creato a partire da tweets_dist.
- Crea
hcdcome dendrogramma usandoas.dendrogram()suhc. - Stampa in console le
labelsdihcd. - Usa
branches_attr_by_labels()per colorare i rami. Passagli tre argomenti: l'oggettohcd,c("marvin", "gaye")e il colore"red". Assegna il risultato ahcd_colored. - Esegui
plot()del dendrogrammahcd_coloredcon il titolo"Better Dendrogram", aggiunto usando l'argomentomain. - Aggiungi rettangoli al grafico usando
rect.dendrogram(). Specificak = 2cluster e un colore diborderpari a"grey50".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create hcd
___ <- ___(___)
# Print the labels in hcd
___(___)
# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)
# Plot hcd_colored
___(___, ___)
# Add cluster rectangles
___(___, ___, ___)