1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 군집 분석

Connected

연습 문제

계층적 군집화: ward 방법

지금은 코믹콘(Comic-Con) 시즌이에요! 코믹콘은 전 세계 주요 도시에서 열리는 연례 만화 박람회입니다. 여러분은 작년 방문자 수(특정 시점에 행사장에 있는 인원 수) 데이터를 가지고 있고, 매출을 극대화하기 위해 부스를 어디에 배치할지 결정하려고 합니다. ward 방법을 사용해 계층적 군집화를 적용하고, 해당 지역에서 사람들을 끌어들이는 두 지점을 찾아보세요.

데이터는 pandas DataFrame인 comic_con에 저장되어 있어요. x_scaled와 y_scaled는 특정 시점에 사람들의 표준화된 X, Y 좌표를 담은 열 이름입니다.

지침

100 XP
  • scipy.cluster.hierarchy에서 fcluster와 linkage를 가져오세요.
  • linkage() 함수에서 ward 방법을 사용하세요.
  • distance_matrix에서 2개의 평면 클러스터를 만들어 클러스터 레이블을 지정하세요.
  • 결과를 보려면 플로팅 코드를 실행하세요.