Segmentasikan pelanggan grosir
Sekarang Anda siap menggunakan hierarchical clustering untuk melakukan segmentasi pasar (yaitu menggunakan karakteristik konsumen untuk mengelompokkan mereka ke dalam subkelompok).
Dalam latihan ini, Anda disediakan besaran pengeluaran dari 45 klien berbeda milik seorang distributor grosir untuk kategori makanan Milk, Grocery, dan Frozen. Data ini disimpan dalam data frame customers_spend. Kelompokkan para klien ini ke dalam cluster yang bermakna.
Catatan: Untuk latihan ini Anda dapat berasumsi bahwa karena semua data bertipe sama (besaran pengeluaran), Anda tidak perlu melakukan skala.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Hitung jarak Euclidean antar pelanggan dan simpan dalam
dist_customers. - Jalankan hierarchical clustering dengan linkage complete dan simpan dalam
hc_customers. - Plot dendrogram.
- Buat vektor penetapan cluster menggunakan tinggi 15.000 dan simpan sebagai
clust_customers. - Hasilkan data frame baru
segment_customersdengan menambahkan penetapan cluster sebagai kolomclusterke data framecustomers_spendyang asli.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate Euclidean distance between customers
dist_customers <- ___
# Generate a complete linkage analysis
hc_customers <- ___
# Plot the dendrogram
# Create a cluster assignment vector at h = 15000
clust_customers <- ___
# Generate the segmented customers data frame
segment_customers <- mutate(___, cluster = ___)