Clustering jerárquico: Árboles de ocupaciones
En el ejercicio anterior aprendiste que los datos de oes están listos para aplicar clustering jerárquico sin necesidad de pasos de preprocesamiento. En este ejercicio, darás los pasos necesarios para construir un dendrograma de ocupaciones a partir de sus salarios medios anuales y proponer clústeres usando una altura de 100,000.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Calcula la distancia euclidiana entre las ocupaciones y guárdala en
dist_oes. - Ejecuta el clustering jerárquico usando el enlace average y guarda el resultado en
hc_oes. - Crea un objeto de dendrograma
dend_oesa partir de tu resultado dehclustusando la funciónas.dendrogram(). - Representa el dendrograma.
- Usando la función
color_branches(), crea y representa un nuevo dendrograma con los clústeres coloreados por un corte a una altura de 100,000.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate Euclidean distance between the occupations
dist_oes <- dist(___, method = ___)
# Generate an average linkage analysis
hc_oes <- hclust(___, method = ___)
# Create a dendrogram object from the hclust variable
dend_oes <- as.dendrogram(___)
# Plot the dendrogram
plot(___)
# Color branches by cluster formed from the cut at a height of 100000
dend_colored <- color_branches(___, h = ___)
# Plot the colored dendrogram
plot(___)