실루엣 방법

이전 레슨에서는 클러스터 수에 따라 K-Means 알고리즘의 성능이 어떻게 달라지는지 살펴봤어요. 인터뷰 상황에서는 최적의 클러스터 수를 찾는 것이 최선의 결과를 내는 데 특히 중요합니다.

이번 연습 문제에서는 sklearn.metrics의 silhouette_score() 함수를 사용해 diabetes DataFrame에 대해 실행한 K-Means 결과에 실루엣 방법을 적용해 최적의 클러스터 수를 찾아볼 거예요. 점수를 계산할 때는 유클리드 거리(euclidean distance)를 사용해 Elbow 방법과 비교 가능하도록 합니다.

K-Means 모델을 학습하는 데 사용할 특성 행렬 X는 미리 생성되어 있어요.