1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 군집 분석

Connected

연습 문제

matplotlib으로 클러스터 시각화하기

클러스터를 평가하고 데이터의 경향을 파악하려면 시각화가 꼭 필요하다고 말씀드렸죠. 이제 matplotlib 모듈을 사용해 Comic-Con의 유동 인구(footfall) 데이터셋을 시각화해 보겠습니다.

데이터는 pandas DataFrame인 comic_con에 저장되어 있습니다. x_scaled와 y_scaled는 특정 시점 사람들의 표준화된 X, Y 좌표의 열 이름입니다. cluster_labels에는 클러스터 레이블이 들어 있습니다. 연결(linkage) 객체는 변수 distance_matrix에 저장되어 있습니다.

지침

100 XP
  • matplotlib 모듈에서 pyplot 클래스를 plt로 임포트하세요.
  • 두 개의 클러스터 레이블 1과 2에 대해 colors 사전을 정의하세요.
  • colors 사전에 지정된 각 클러스터 색으로 산점도를 그리세요.