최적의 클러스터 개수 결정하기

여기서는 엘보 기준(elbow criterion) 방법을 사용해, 제곱 오차 합(SSE)의 감소 폭이 미미해지는 지점에서 최적의 클러스터 개수를 찾아보겠습니다. 이는 테스트를 시작하기 위한 합리적인 클러스터 수를 수학적으로 가늠하는 중요한 단계입니다. 여러 k 값에 대해 각각 KMeans 알고리즘을 실행하고, 각 k에 대한 오류를 그래프로 그려 오류 감소 속도가 둔화되는 "엘보" 지점을 확인하세요.

KMeans 모듈은 sklearn.cluster에서 불러왔고, seaborn 라이브러리는 sns로, matplotlib.pyplot 모듈은 plt로 로드되어 있습니다. 또한, 스케일링된 데이터셋은 pandas DataFrame인 wholesale_scaled_df로 제공됩니다.