Crea una segmentación con k-means clustering

En este ejercicio vas a crear la segmentación de clientes con el algoritmo KMeans. Como identificaste en el paso anterior, el número óptimo de clústeres desde el punto de vista matemático está entre 3 y 4. Aquí construirás una con 4 segmentos.

El conjunto de datos preprocesado se ha cargado como wholesale_scaled_df. Lo usarás para ejecutar el algoritmo KMeans, y el conjunto de datos sin procesar como wholesale; más adelante lo utilizarás para explorar los valores medios de las columnas para los 4 segmentos que construirás.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

Importa el algoritmo KMeans del módulo sklearn.cluster.
Inicializa el algoritmo KMeans con 4 clústeres y random_state establecido en 123.
Ajusta el modelo sobre el conjunto de datos preprocesado wholesale_scaled_df.
Asigna las etiquetas generadas a una nueva columna llamada segment en el conjunto de datos en bruto wholesale

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)

Editar y ejecutar código