Estética del dendrograma
Has creado un dendrograma… ¡pero no llama tanto la atención como esperabas!
El paquete dendextend puede ayudar a tu audiencia coloreando las ramas y marcando los clústeres. dendextend está diseñado para trabajar con objetos de tipo dendrograma, así que tendrás que convertir el clúster jerárquico de hclust usando as.dendrogram().
Una buena forma de revisar los términos de tu dendrograma es con la función labels(). Imprimirá todos los términos del dendrograma. Para resaltar ramas específicas, usa branches_attr_by_labels(). Primero, pasa el objeto dendrograma y luego un vector de términos como en c("data", "camp"). Por último, añade un color como "blue".
Después de crear tu gráfico, puedes destacar clústeres con rect.dendrogram(). Esto añade rectángulos para cada clúster. El primer argumento de rect.dendrogram() es el dendrograma, seguido del número de clústeres (k). También puedes pasar un argumento border para especificar el color de los rectángulos (p. ej., "green").
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
El paquete dendextend ya está cargado para ti y se creó un objeto de clúster jerárquico, hc, a partir de tweets_dist.
- Crea
hcdcomo un dendrograma usandoas.dendrogram()sobrehc. - Imprime en la consola las
labelsdehcd. - Usa
branches_attr_by_labels()para colorear las ramas. Pásale tres argumentos: el objetohcd,c("marvin", "gaye")y el color"red". Asígnalo ahcd_colored. plot()el dendrogramahcd_coloredcon el título"Better Dendrogram", añadido usando el argumentomain.- Añade rectángulos al gráfico usando
rect.dendrogram(). Especificak = 2clústeres y un color deborder"grey50".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create hcd
___ <- ___(___)
# Print the labels in hcd
___(___)
# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)
# Plot hcd_colored
___(___, ___)
# Add cluster rectangles
___(___, ___, ___)