Segmenter les clients de gros
Vous êtes maintenant prêt à utiliser le clustering hiérarchique pour réaliser une segmentation de marché (c’est-à-dire regrouper les consommateurs en sous-groupes selon leurs caractéristiques).
Dans cet exercice, on vous fournit les montants dépensés par 45 clients d’un distributeur de gros pour les catégories alimentaires Milk, Grocery et Frozen. Ces données sont stockées dans le data frame customers_spend. Attribuez ces clients à des clusters pertinents.
Remarque : Pour cet exercice, vous pouvez supposer que toutes les données sont du même type (montant dépensé) et qu’il n’est donc pas nécessaire de les mettre à l’échelle.
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Calculez la distance euclidienne entre les clients et stockez-la dans
dist_customers. - Exécutez un clustering hiérarchique avec une liaison complete et stockez le résultat dans
hc_customers. - Tracez le dendrogramme.
- Créez un vecteur d’assignation de clusters en utilisant une hauteur de 15 000 et stockez-le dans
clust_customers. - Générez un nouveau data frame
segment_customersen ajoutant l’assignation de cluster comme colonneclusterau data framecustomers_spendd’origine.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate Euclidean distance between customers
dist_customers <- ___
# Generate a complete linkage analysis
hc_customers <- ___
# Plot the dendrogram
# Create a cluster assignment vector at h = 15000
clust_customers <- ___
# Generate the segmented customers data frame
segment_customers <- mutate(___, cluster = ___)