MulaiMulai sekarang secara gratis

Meninjau ulang data grosir: Eksplorasi

Dari analisis sebelumnya Anda menemukan bahwa k = 2 memiliki rata-rata lebar siluet tertinggi. Pada latihan ini Anda akan melanjutkan menganalisis data pelanggan grosir dengan membangun dan mengeksplorasi model kmeans dengan 2 klaster.

Latihan ini adalah bagian dari kursus

Analisis Klaster di R

Lihat Kursus

Petunjuk latihan

  • Bangun model k-means bernama model_customers untuk data customers_spend menggunakan fungsi kmeans() dengan centers = 2.
  • Ekstrak vektor penetapan klaster dari model model_customers$cluster dan simpan ke variabel clust_customers.
  • Tambahkan penetapan klaster sebagai kolom cluster ke data frame customers_spend dan simpan hasilnya ke data frame baru bernama segment_customers.
  • Hitung ukuran tiap klaster menggunakan count().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

set.seed(42)

# Build a k-means model for the customers_spend with a k of 2
model_customers <- ___

# Extract the vector of cluster assignments from the model
clust_customers <- ___

# Build the segment_customers data frame
segment_customers <- mutate(___, cluster = ___)

# Calculate the size of each cluster
count(___, ___)

# Calculate the mean for each category
segment_customers %>% 
  group_by(cluster) %>% 
  summarise_all(list(mean))
Edit dan Jalankan Kode