CommencerCommencer gratuitement

Construire une segmentation avec le clustering k-means

Dans cet exercice, vous allez construire une segmentation client avec l’algorithme KMeans. Comme vous l’avez identifié à l’étape précédente, le nombre de clusters optimal mathématiquement se situe autour de 3 ou 4. Ici, vous allez en construire une avec 4 segments.

Le jeu de données prétraité a été chargé sous le nom wholesale_scaled_df. Vous l’utiliserez pour exécuter l’algorithme KMeans, et le jeu de données brut non prétraité wholesale — vous l’utiliserez ensuite pour explorer les valeurs moyennes des colonnes pour les 4 segments que vous allez construire.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

  • Importez l’algorithme KMeans depuis le module sklearn.cluster.
  • Initialisez l’algorithme KMeans avec 4 clusters et un random state fixé à 123.
  • Entraînez le modèle sur le jeu de données prétraité wholesale_scaled_df.
  • Assignez les labels générés à une nouvelle colonne appelée segment dans le jeu de données brut wholesale.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)
Modifier et exécuter le code