1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 데이터 프라이버시와 익명화

Connected

연습 문제

고객 세분화

이 연습 문제에서는 Mall Customer Segmentation Dataset에 차등 프라이버시 클러스터링 모델을 적용해 고객 세분화를 수행해 볼 거예요.

K-means 클러스터링에서는 엘보(elbow) 방법으로 최적 클러스터 개수를 계산할 수 있어요.

Resulting graphic from Elbow method with non-private model
이 그래픽을 보면 최적 클러스터 수는 5임을 알 수 있어요. Annual Income과 Spending Score를 기준으로 클러스터링할 것이며, 두 변수를 X로 불러왔고 결과 클러스터를 시각화할 거예요.

전체 데이터셋은 mall_df로 로드되어 있어요. 편의를 위해 클러스터를 그려주는 사용자 정의 함수 show_clusters()도 제공됩니다. 자세한 내용은 ?show_clusters로 확인하세요.

지침 1/3

undefined XP
    1
    2
    3
  • 5개의 클러스터를 사용하는 프라이빗 클러스터링 모델을 초기화하세요.