Jelajahi klaster pelanggan grosir
Melanjutkan pekerjaan Anda pada himpunan data grosir, sekarang Anda siap menganalisis karakteristik klaster-klaster tersebut.
Karena Anda bekerja dengan lebih dari 2 dimensi, akan sulit untuk memvisualisasikan plot sebar klaster; alih-alih, Anda akan mengandalkan statistik ringkasan untuk mengeksplorasi klaster ini. Dalam latihan ini, Anda akan menganalisis rata-rata jumlah pengeluaran di setiap klaster untuk ketiga kategori.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Hitung ukuran setiap klaster menggunakan
count(). - Warnai dan plot dendrogram dengan tinggi 15.000.
- Hitung rata-rata pengeluaran untuk setiap kategori di dalam setiap klaster menggunakan fungsi
summarise_all().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
dist_customers <- dist(customers_spend)
hc_customers <- hclust(dist_customers)
clust_customers <- cutree(hc_customers, h = 15000)
segment_customers <- mutate(customers_spend, cluster = clust_customers)
# Count the number of customers that fall into each cluster
count(___, ___)
# Color the dendrogram based on the height cutoff
dend_customers <- as.dendrogram(hc_customers)
dend_colored <- color_branches(___, ___)
# Plot the colored dendrogram
# Calculate the mean for each category
segment_customers %>%
group_by(cluster) %>%
summarise_all(list(mean))