ComenzarEmpieza gratis

Crea una segmentación con k-means clustering

En este ejercicio vas a crear la segmentación de clientes con el algoritmo KMeans. Como identificaste en el paso anterior, el número óptimo de clústeres desde el punto de vista matemático está entre 3 y 4. Aquí construirás una con 4 segmentos.

El conjunto de datos preprocesado se ha cargado como wholesale_scaled_df. Lo usarás para ejecutar el algoritmo KMeans, y el conjunto de datos sin procesar como wholesale; más adelante lo utilizarás para explorar los valores medios de las columnas para los 4 segmentos que construirás.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

  • Importa el algoritmo KMeans del módulo sklearn.cluster.
  • Inicializa el algoritmo KMeans con 4 clústeres y random_state establecido en 123.
  • Ajusta el modelo sobre el conjunto de datos preprocesado wholesale_scaled_df.
  • Asigna las etiquetas generadas a una nueva columna llamada segment en el conjunto de datos en bruto wholesale

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)
Editar y ejecutar código