ComenzarEmpieza gratis

Explora los clústeres de clientes mayoristas

Continuando con el conjunto de datos de mayoristas, ya estás listo para analizar las características de estos clústeres.

Como trabajas con más de 2 dimensiones, sería complicado visualizar un diagrama de dispersión de los clústeres; en su lugar, te basarás en estadísticas resumidas para explorarlos. En este ejercicio analizarás el gasto medio de cada clúster en las tres categorías.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Calcula el tamaño de cada clúster usando count().
  • Colorea y representa el dendrograma usando una altura de 15,000.
  • Calcula el gasto medio de cada categoría dentro de cada clúster usando la función summarise_all().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

dist_customers <- dist(customers_spend)
hc_customers <- hclust(dist_customers)
clust_customers <- cutree(hc_customers, h = 15000)
segment_customers <- mutate(customers_spend, cluster = clust_customers)

# Count the number of customers that fall into each cluster
count(___, ___)

# Color the dendrogram based on the height cutoff
dend_customers <- as.dendrogram(hc_customers)
dend_colored <- color_branches(___, ___)

# Plot the colored dendrogram


# Calculate the mean for each category
segment_customers %>% 
  group_by(cluster) %>% 
  summarise_all(list(mean))
Editar y ejecutar código