1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Exercise

계층적 응집 군집화

이전 연습 문제에서 K-means 군집화를 수행할 때 군집 수가 결과에 어떤 영향을 미치는지 살펴보았고, 이를 바탕으로 Machine Learning 인터뷰에서 K-means를 설명할 수 있게 되었어요. 하지만 사용할 수 있는 또 다른 군집화 모델로는 계층적 응집 군집화가 있어요. Python에서는 이 기법의 최적 군집 수를 시각적으로도, 수학적으로도 구할 수 있어요. 두 방법 모두를 위해 scipy와 sklearn 모듈을 사용할 거예요.

덴드로그램에서 최적 군집 수를 선택하는 것은 연결(linkage) 기준과 거리 임계값에 모두 좌우된다는 점을 기억하세요. 여기서는 diabetes의 X 행렬로 덴드로그램을 만들고, 길이 1.50에서 가상의 수평선을 그어 교차하는 수직선의 개수를 셈으로써 앞으로 진행할 계층적 군집화 알고리즘의 최적 군집 수를 구해 볼 거예요.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • 덴드로그램을 만들고 계층적 응집 군집화를 수행하기 위한 관련 패키지를 임포트하세요.