k-means 클러스터링으로 세분화 구축하기

이 연습 문제에서는 KMeans 알고리즘으로 고객 세분화를 구축해 보겠습니다. 이전 단계에서 확인했듯이, 수학적으로 최적인 클러스터 수는 3과 4 사이에 있습니다. 여기서는 4개 세그먼트로 모델을 구성해 볼게요.

전처리된 데이터셋은 wholesale_scaled_df로 로드되어 있습니다. 이를 사용해 KMeans 알고리즘을 실행하고, 원본 비전처리 데이터셋 wholesale은 나중에 생성할 4개 세그먼트의 평균 열 값을 탐색하는 데 사용할 거예요.