ComenzarEmpieza gratis

Revisita de los datos de mayoristas: exploración

En el análisis anterior viste que k = 2 tiene la anchura media de la silueta más alta. En este ejercicio seguirás analizando los datos de clientes mayoristas creando y explorando un modelo k-means con 2 clústeres.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Crea un modelo k-means llamado model_customers para los datos customers_spend usando la función kmeans() con centers = 2.
  • Extrae el vector de asignaciones de clúster del modelo model_customers$cluster y guárdalo en la variable clust_customers.
  • Añade las asignaciones de clúster como una columna cluster al data frame customers_spend y guarda el resultado en un nuevo data frame llamado segment_customers.
  • Calcula el tamaño de cada clúster usando count().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

set.seed(42)

# Build a k-means model for the customers_spend with a k of 2
model_customers <- ___

# Extract the vector of cluster assignments from the model
clust_customers <- ___

# Build the segment_customers data frame
segment_customers <- mutate(___, cluster = ___)

# Calculate the size of each cluster
count(___, ___)

# Calculate the mean for each category
segment_customers %>% 
  group_by(cluster) %>% 
  summarise_all(list(mean))
Editar y ejecutar código