Meninjau ulang data grosir: Eksplorasi
Dari analisis sebelumnya Anda menemukan bahwa k = 2 memiliki rata-rata lebar siluet tertinggi. Pada latihan ini Anda akan melanjutkan menganalisis data pelanggan grosir dengan membangun dan mengeksplorasi model kmeans dengan 2 klaster.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Bangun model k-means bernama
model_customersuntuk datacustomers_spendmenggunakan fungsikmeans()dengancenters = 2. - Ekstrak vektor penetapan klaster dari model
model_customers$clusterdan simpan ke variabelclust_customers. - Tambahkan penetapan klaster sebagai kolom
clusterke data framecustomers_spenddan simpan hasilnya ke data frame baru bernamasegment_customers. - Hitung ukuran tiap klaster menggunakan
count().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
set.seed(42)
# Build a k-means model for the customers_spend with a k of 2
model_customers <- ___
# Extract the vector of cluster assignments from the model
clust_customers <- ___
# Build the segment_customers data frame
segment_customers <- mutate(___, cluster = ___)
# Calculate the size of each cluster
count(___, ___)
# Calculate the mean for each category
segment_customers %>%
group_by(cluster) %>%
summarise_all(list(mean))