1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Unsupervised Learning

Connected

연습 문제

클러스터 레이블 추출하기

이전 연습 문제에서 높이 6에서 곡물 샘플의 중간 클러스터링이 3개의 클러스터를 갖는 것을 확인했어요. 이제 fcluster() 함수를 사용해 이 중간 클러스터링의 레이블을 추출하고, 교차표를 통해 레이블을 곡물 품종과 비교해 보세요.

계층적 클러스터링은 이미 수행되었고, mergings는 linkage() 함수의 결과예요. 리스트 varieties에는 각 곡물 샘플의 품종이 담겨 있어요.

지침

100 XP
  • 다음을 임포트하세요:
    • pandas를 pd로.
    • scipy.cluster.hierarchy에서 fcluster.
  • mergings에 대해 fcluster() 함수를 사용해 평면형 계층적 클러스터링을 수행하세요. 최대 높이는 6으로 지정하고, 키워드 인수 criterion='distance'를 설정하세요.
  • 두 열 'labels'와 'varieties'를 가진 DataFrame df를 생성하고, 각각 열 값으로 labels와 varieties를 사용하세요. 이는 이미 준비되어 있어요.
  • df['labels']와 df['varieties'] 사이의 교차표 ct를 만들어, 각 곡물 품종이 각 클러스터 레이블과 몇 번 일치하는지 집계하세요.