Construire une segmentation avec le clustering k-means
Dans cet exercice, vous allez construire une segmentation client avec l’algorithme KMeans. Comme vous l’avez identifié à l’étape précédente, le nombre de clusters optimal mathématiquement se situe autour de 3 ou 4. Ici, vous allez en construire une avec 4 segments.
Le jeu de données prétraité a été chargé sous le nom wholesale_scaled_df. Vous l’utiliserez pour exécuter l’algorithme KMeans, et le jeu de données brut non prétraité wholesale — vous l’utiliserez ensuite pour explorer les valeurs moyennes des colonnes pour les 4 segments que vous allez construire.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Importez l’algorithme
KMeansdepuis le modulesklearn.cluster. - Initialisez l’algorithme
KMeansavec 4 clusters et un random state fixé à 123. - Entraînez le modèle sur le jeu de données prétraité
wholesale_scaled_df. - Assignez les labels générés à une nouvelle colonne appelée
segmentdans le jeu de données brutwholesale.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import `KMeans` module
from sklearn.cluster import ___
# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)
# Fit the model on the pre-processed dataset
kmeans.fit(___)
# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)