1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Phân khúc khách hàng

Trong bài tập này, bạn sẽ thực hiện Phân khúc Khách hàng từ Mall Customer Segmentation Dataset bằng một mô hình phân cụm đảm bảo quyền riêng tư vi sai.

Với K-means clustering, bạn có thể xác định số cụm tối ưu bằng phương pháp khuỷu tay (elbow method).

Biểu đồ kết quả từ phương pháp Elbow với mô hình không riêng tư
Từ biểu đồ trên, có thể thấy số cụm tối ưu là 5. Bạn sẽ phân cụm dựa trên Annual Income và Spending Score, đã được nạp vào X, và vẽ các cụm kết quả.

Toàn bộ dữ liệu đã được nạp vào mall_df. Để tiện lợi, một hàm tùy chỉnh show_clusters() để vẽ cụm đã được cung cấp cho bạn. Dùng ?show_clusters để tìm hiểu thêm về hàm này.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Khởi tạo mô hình phân cụm riêng tư với 5 cụm.