Estética de dendrogramas
Então você fez um dendrograma… mas ele não chama tanto a atenção quanto você esperava!
O pacote dendextend pode ajudar seu público colorindo os ramos e destacando os clusters. O dendextend foi projetado para operar em objetos de dendrograma, então você vai precisar converter o cluster hierárquico de hclust usando as.dendrogram().
Uma boa forma de revisar os termos no seu dendrograma é com a função labels(). Ela imprime todos os termos do dendrograma. Para destacar ramos específicos, use branches_attr_by_labels(). Primeiro, passe o objeto de dendrograma, depois um vetor de termos como em c("data", "camp"). Por fim, adicione uma cor como "blue".
Depois de criar seu gráfico, você pode destacar clusters com rect.dendrogram(). Isso adiciona retângulos para cada cluster. O primeiro argumento de rect.dendrogram() é o dendrograma, seguido pelo número de clusters (k). Você também pode passar um argumento border especificando a cor que quer para os retângulos (por exemplo, "green").
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
O pacote dendextend já foi carregado para você, e um objeto de cluster hierárquico, hc, foi criado a partir de tweets_dist.
- Crie
hcdcomo um dendrograma usandoas.dendrogram()emhc. - Imprima os
labelsdehcdno console. - Use
branches_attr_by_labels()para colorir os ramos. Passe três argumentos: o objetohcd,c("marvin", "gaye")e a cor"red". Atribua ahcd_colored. - Faça o
plot()do dendrogramahcd_coloredcom o título"Better Dendrogram", adicionado usando o argumentomain. - Adicione retângulos ao gráfico usando
rect.dendrogram(). Especifiquek = 2clusters e uma cor deborderigual a"grey50".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create hcd
___ <- ___(___)
# Print the labels in hcd
___(___)
# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)
# Plot hcd_colored
___(___, ___)
# Add cluster rectangles
___(___, ___, ___)