CommencerCommencer gratuitement

Explorer les clusters de clients de gros

En poursuivant votre travail sur l’ensemble de données de vente en gros, vous êtes maintenant prêt à analyser les caractéristiques de ces clusters.

Comme vous travaillez avec plus de deux dimensions, il serait difficile de visualiser un nuage de points des clusters ; vous allez donc vous appuyer sur des statistiques descriptives pour les explorer. Dans cet exercice, vous analyserez le montant moyen dépensé dans chaque cluster pour les trois catégories.

Cet exercice fait partie du cours

Analyse de clusters avec R

Afficher le cours

Instructions

  • Calculez la taille de chaque cluster à l’aide de count().
  • Colorez et tracez le dendrogramme en utilisant une hauteur de 15 000.
  • Calculez la dépense moyenne pour chaque catégorie dans chaque cluster à l’aide de la fonction summarise_all().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

dist_customers <- dist(customers_spend)
hc_customers <- hclust(dist_customers)
clust_customers <- cutree(hc_customers, h = 15000)
segment_customers <- mutate(customers_spend, cluster = clust_customers)

# Count the number of customers that fall into each cluster
count(___, ___)

# Color the dendrogram based on the height cutoff
dend_customers <- as.dendrogram(hc_customers)
dend_colored <- color_branches(___, ___)

# Plot the colored dendrogram


# Calculate the mean for each category
segment_customers %>% 
  group_by(cluster) %>% 
  summarise_all(list(mean))
Modifier et exécuter le code