ComeçarComece de graça

Construa a segmentação com k-means clustering

Neste exercício, você vai construir a segmentação de clientes com o algoritmo KMeans. Como você identificou na etapa anterior, o número matematicamente ideal de clusters fica entre 3 e 4. Aqui, você vai criar uma segmentação com 4 grupos.

O conjunto de dados pré-processado foi carregado como wholesale_scaled_df. Você vai usá-lo para rodar o algoritmo KMeans, e o conjunto de dados bruto, não processado, como wholesale — que será usado depois para explorar os valores médios das colunas para os 4 segmentos que você vai construir.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Importe o algoritmo KMeans do módulo sklearn.cluster.
  • Inicialize o algoritmo KMeans com 4 clusters e random_state igual a 123.
  • Treine o modelo no conjunto de dados pré-processado wholesale_scaled_df.
  • Atribua os rótulos gerados a uma nova coluna chamada segment no conjunto de dados bruto wholesale

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)
Editar e executar o código