1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Xem lại dữ liệu bán buôn: Khám phá

Từ phân tích trước đó, bạn đã thấy rằng k = 2 có độ rộng silhouette trung bình cao nhất. Trong bài tập này, bạn sẽ tiếp tục phân tích dữ liệu khách hàng bán buôn bằng cách xây dựng và khám phá một mô hình kmeans với 2 cụm.

Hướng dẫn

100 XP
  • Xây dựng mô hình k-means tên model_customers cho dữ liệu customers_spend bằng hàm kmeans() với centers = 2.
  • Trích xuất vector gán cụm từ mô hình model_customers$cluster và lưu vào biến clust_customers.
  • Gắn các nhãn cụm như một cột cluster vào data frame customers_spend và lưu kết quả thành một data frame mới tên segment_customers.
  • Tính kích thước của mỗi cụm bằng count().