1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Marketing với Python

Connected

Bài tập

Xây dựng phân khúc bằng phân cụm k-means

Trong bài tập này, bạn sẽ xây dựng phân khúc khách hàng bằng thuật toán KMeans. Như bạn đã xác định ở bước trước, số cụm tối ưu theo toán học nằm khoảng 3 đến 4. Ở đây, bạn sẽ xây dựng mô hình với 4 phân khúc.

Bộ dữ liệu đã tiền xử lý đã được nạp dưới tên wholesale_scaled_df. Bạn sẽ dùng nó để chạy thuật toán KMeans, và bộ dữ liệu thô chưa xử lý là wholesale — bạn sẽ dùng bộ này sau để khám phá giá trị trung bình theo cột cho 4 phân khúc bạn tạo ra.

Hướng dẫn

100 XP
  • Import thuật toán KMeans từ module sklearn.cluster.
  • Khởi tạo thuật toán KMeans với 4 cụm và random_state đặt là 123.
  • Fit mô hình trên bộ dữ liệu đã tiền xử lý wholesale_scaled_df.
  • Gán các nhãn sinh ra vào một cột mới tên segment trong bộ dữ liệu thô wholesale