Revisita de los datos de mayoristas: exploración
En el análisis anterior viste que k = 2 tiene la anchura media de la silueta más alta. En este ejercicio seguirás analizando los datos de clientes mayoristas creando y explorando un modelo k-means con 2 clústeres.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Crea un modelo k-means llamado
model_customerspara los datoscustomers_spendusando la funciónkmeans()concenters = 2. - Extrae el vector de asignaciones de clúster del modelo
model_customers$clustery guárdalo en la variableclust_customers. - Añade las asignaciones de clúster como una columna
clusteral data framecustomers_spendy guarda el resultado en un nuevo data frame llamadosegment_customers. - Calcula el tamaño de cada clúster usando
count().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
set.seed(42)
# Build a k-means model for the customers_spend with a k of 2
model_customers <- ___
# Extract the vector of cluster assignments from the model
clust_customers <- ___
# Build the segment_customers data frame
segment_customers <- mutate(___, cluster = ___)
# Calculate the size of each cluster
count(___, ___)
# Calculate the mean for each category
segment_customers %>%
group_by(cluster) %>%
summarise_all(list(mean))