ComenzarEmpieza gratis

Clustering jerárquico: Árboles de ocupaciones

En el ejercicio anterior aprendiste que los datos de oes están listos para aplicar clustering jerárquico sin necesidad de pasos de preprocesamiento. En este ejercicio, darás los pasos necesarios para construir un dendrograma de ocupaciones a partir de sus salarios medios anuales y proponer clústeres usando una altura de 100,000.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Calcula la distancia euclidiana entre las ocupaciones y guárdala en dist_oes.
  • Ejecuta el clustering jerárquico usando el enlace average y guarda el resultado en hc_oes.
  • Crea un objeto de dendrograma dend_oes a partir de tu resultado de hclust usando la función as.dendrogram().
  • Representa el dendrograma.
  • Usando la función color_branches(), crea y representa un nuevo dendrograma con los clústeres coloreados por un corte a una altura de 100,000.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate Euclidean distance between the occupations
dist_oes <- dist(___, method = ___)

# Generate an average linkage analysis 
hc_oes <- hclust(___, method = ___)

# Create a dendrogram object from the hclust variable
dend_oes <- as.dendrogram(___)

# Plot the dendrogram
plot(___)

# Color branches by cluster formed from the cut at a height of 100000
dend_colored <- color_branches(___, h = ___)

# Plot the colored dendrogram
plot(___)
Editar y ejecutar código