1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 마케팅용 Machine Learning

Connected

연습 문제

k-means 클러스터링으로 세분화 구축하기

이 연습 문제에서는 KMeans 알고리즘으로 고객 세분화를 구축해 보겠습니다. 이전 단계에서 확인했듯이, 수학적으로 최적인 클러스터 수는 3과 4 사이에 있습니다. 여기서는 4개 세그먼트로 모델을 구성해 볼게요.

전처리된 데이터셋은 wholesale_scaled_df로 로드되어 있습니다. 이를 사용해 KMeans 알고리즘을 실행하고, 원본 비전처리 데이터셋 wholesale은 나중에 생성할 4개 세그먼트의 평균 열 값을 탐색하는 데 사용할 거예요.

지침

100 XP
  • sklearn.cluster 모듈에서 KMeans 알고리즘을 import하세요.
  • 클러스터 수를 4로, random_state를 123으로 설정해 KMeans 알고리즘을 초기화하세요.
  • 전처리된 wholesale_scaled_df 데이터셋으로 모델을 학습(fit)하세요.
  • 생성된 레이블을 원본 wholesale 데이터셋의 segment라는 새 열에 할당하세요.