Construire une segmentation avec le clustering k-means

Dans cet exercice, vous allez construire une segmentation client avec l’algorithme KMeans. Comme vous l’avez identifié à l’étape précédente, le nombre de clusters optimal mathématiquement se situe autour de 3 ou 4. Ici, vous allez en construire une avec 4 segments.

Le jeu de données prétraité a été chargé sous le nom wholesale_scaled_df. Vous l’utiliserez pour exécuter l’algorithme KMeans, et le jeu de données brut non prétraité wholesale — vous l’utiliserez ensuite pour explorer les valeurs moyennes des colonnes pour les 4 segments que vous allez construire.

Cet exercice fait partie du cours

<cours>Machine Learning pour le marketing en Python</cours>

Voir le cours

Instructions de l’exercice

Importez l’algorithme KMeans depuis le module sklearn.cluster.
Initialisez l’algorithme KMeans avec 4 clusters et un random state fixé à 123.
Entraînez le modèle sur le jeu de données prétraité wholesale_scaled_df.
Assignez les labels générés à une nouvelle colonne appelée segment dans le jeu de données brut wholesale.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)

Modifier et exécuter le code