1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân cụm bằng R

Connected

Bài tập

Phân khúc khách hàng bán buôn

Giờ bạn đã sẵn sàng dùng phân cụm phân cấp để thực hiện phân khúc thị trường (tức là dùng đặc điểm người tiêu dùng để gom họ vào các nhóm nhỏ hơn).

Trong bài này, bạn được cung cấp số tiền chi tiêu của 45 khách hàng khác nhau của một nhà phân phối bán buôn cho các nhóm hàng thực phẩm: Milk, Grocery & Frozen. Dữ liệu được lưu trong data frame customers_spend. Hãy phân các khách hàng này vào những cụm có ý nghĩa.

Lưu ý: Với bài này, bạn có thể giả định rằng vì tất cả dữ liệu đều cùng một loại (số tiền chi tiêu) nên bạn không cần chuẩn hóa (scale) dữ liệu.

Hướng dẫn

100 XP
  • Tính khoảng cách Euclid giữa các khách hàng và lưu vào dist_customers.
  • Chạy phân cụm phân cấp với tiêu chí liên kết complete và lưu vào hc_customers.
  • Vẽ dendrogram.
  • Tạo vector gán cụm với ngưỡng chiều cao 15.000 và lưu là clust_customers.
  • Tạo data frame mới segment_customers bằng cách thêm cột gán cụm cluster vào data frame gốc customers_spend.