ComenzarEmpieza gratis

Clustering jerárquico: preparación para la exploración

Ya has creado un posible clustering para los datos de oes. Antes de poder explorar estos clústeres con ggplot2, necesitas transformar la matriz de datos oes en un data frame ordenado, asignando a cada ocupación su clúster.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Crea el data frame df_oes a partir de la data.matrix oes, asegurándote de guardar el nombre de fila como una columna (usa rownames_to_column() de la librería tibble).
  • Construye el vector de asignación de clústeres cut_oes usando cutree() con h = 100,000.
  • Añade las asignaciones de clúster como una columna cluster al data frame df_oes y guarda el resultado en un nuevo data frame llamado clust_oes.
  • Usa la función pivot_longer() de la librería tidyr() para reestructurar los datos a un formato adecuado para el análisis con ggplot2 y guarda el data frame ordenado como gathered_oes.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

dist_oes <- dist(oes, method = 'euclidean')
hc_oes <- hclust(dist_oes, method = 'average')

library(tibble)
library(tidyr)

# Use rownames_to_column to move the rownames into a column of the data frame
df_oes <- rownames_to_column(as.data.frame(___), var = 'occupation')

# Create a cluster assignment vector at h = 100,000
cut_oes <- cutree(___, h = ___)

# Generate the segmented oes data frame
clust_oes <- mutate(___, cluster = ___)

# Create a tidy data frame by gathering the year and values into two columns
gathered_oes <- pivot_longer(data = ___, 
                       cols = -c(occupation, cluster),
                       names_to = "year",               
                       values_to = "mean_salary" )
Editar y ejecutar código