Clustering jerárquico: preparación para la exploración
Ya has creado un posible clustering para los datos de oes. Antes de poder explorar estos clústeres con ggplot2, necesitas transformar la matriz de datos oes en un data frame ordenado, asignando a cada ocupación su clúster.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Crea el data frame
df_oesa partir de la data.matrixoes, asegurándote de guardar el nombre de fila como una columna (usarownames_to_column()de la libreríatibble). - Construye el vector de asignación de clústeres
cut_oesusandocutree()conh = 100,000. - Añade las asignaciones de clúster como una columna
clusteral data framedf_oesy guarda el resultado en un nuevo data frame llamadoclust_oes. - Usa la función
pivot_longer()de la libreríatidyr()para reestructurar los datos a un formato adecuado para el análisis con ggplot2 y guarda el data frame ordenado comogathered_oes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
dist_oes <- dist(oes, method = 'euclidean')
hc_oes <- hclust(dist_oes, method = 'average')
library(tibble)
library(tidyr)
# Use rownames_to_column to move the rownames into a column of the data frame
df_oes <- rownames_to_column(as.data.frame(___), var = 'occupation')
# Create a cluster assignment vector at h = 100,000
cut_oes <- cutree(___, h = ___)
# Generate the segmented oes data frame
clust_oes <- mutate(___, cluster = ___)
# Create a tidy data frame by gathering the year and values into two columns
gathered_oes <- pivot_longer(data = ___,
cols = -c(occupation, cluster),
names_to = "year",
values_to = "mean_salary" )