Explora los clústeres de clientes mayoristas
Continuando con el conjunto de datos de mayoristas, ya estás listo para analizar las características de estos clústeres.
Como trabajas con más de 2 dimensiones, sería complicado visualizar un diagrama de dispersión de los clústeres; en su lugar, te basarás en estadísticas resumidas para explorarlos. En este ejercicio analizarás el gasto medio de cada clúster en las tres categorías.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Calcula el tamaño de cada clúster usando
count(). - Colorea y representa el dendrograma usando una altura de 15,000.
- Calcula el gasto medio de cada categoría dentro de cada clúster usando la función
summarise_all().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
dist_customers <- dist(customers_spend)
hc_customers <- hclust(dist_customers)
clust_customers <- cutree(hc_customers, h = 15000)
segment_customers <- mutate(customers_spend, cluster = clust_customers)
# Count the number of customers that fall into each cluster
count(___, ___)
# Color the dendrogram based on the height cutoff
dend_customers <- as.dendrogram(hc_customers)
dend_colored <- color_branches(___, ___)
# Plot the colored dendrogram
# Calculate the mean for each category
segment_customers %>%
group_by(cluster) %>%
summarise_all(list(mean))