Construa a segmentação com k-means clustering
Neste exercício, você vai construir a segmentação de clientes com o algoritmo KMeans. Como você identificou na etapa anterior, o número matematicamente ideal de clusters fica entre 3 e 4. Aqui, você vai criar uma segmentação com 4 grupos.
O conjunto de dados pré-processado foi carregado como wholesale_scaled_df. Você vai usá-lo para rodar o algoritmo KMeans, e o conjunto de dados bruto, não processado, como wholesale — que será usado depois para explorar os valores médios das colunas para os 4 segmentos que você vai construir.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Importe o algoritmo
KMeansdo módulosklearn.cluster. - Inicialize o algoritmo
KMeanscom 4 clusters erandom_stateigual a 123. - Treine o modelo no conjunto de dados pré-processado
wholesale_scaled_df. - Atribua os rótulos gerados a uma nova coluna chamada
segmentno conjunto de dados brutowholesale
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import `KMeans` module
from sklearn.cluster import ___
# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)
# Fit the model on the pre-processed dataset
kmeans.fit(___)
# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)