1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Unsupervised Learning

Connected

연습 문제

물고기 데이터 클러스터링

이전 연습 문제에서 만든 표준화와 클러스터링 파이프라인을 사용해 물고기를 측정값으로 클러스터링한 다음, 교차표를 만들어 클러스터 레이블과 물고기 종을 비교해 보겠습니다.

이전과 마찬가지로, samples는 물고기 측정값이 담긴 2차원 배열입니다. 파이프라인은 pipeline으로 제공되며, 각 물고기 샘플의 종은 리스트 species로 주어집니다.

지침

100 XP
  • pandas를 pd로 임포트하세요.
  • 물고기 측정값 samples에 파이프라인을 학습시키세요.
  • pipeline의 .predict() 메서드를 사용해 samples의 클러스터 레이블을 얻으세요.
  • pd.DataFrame()을 사용해 두 열 'labels'와 'species'를 가진 DataFrame df를 생성하고, 각 열의 값으로 각각 labels와 species를 사용하세요.
  • pd.crosstab()을 사용해 df['labels']와 df['species']의 교차표 ct를 만드세요.