1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Unsupervised Learning

Connected

연습 문제

클러스터링을 위한 물고기 데이터 스케일링

물고기의 측정값이 담긴 배열 samples가 제공됩니다. 각 행은 한 마리의 물고기를 나타냅니다. 그램 단위의 무게, 센티미터 단위의 길이, 높이 대비 길이의 백분율 같은 측정값은 서로 스케일이 많이 다릅니다. 이 데이터를 효과적으로 클러스터링하려면 먼저 이러한 특성들을 표준화해야 해요. 이번 연습에서는 데이터를 표준화하고 클러스터링하는 파이프라인을 만들어 보겠습니다.

이 물고기 측정 데이터는 Journal of Statistics Education에서 제공되었습니다.

지침

100 XP
  • 다음을 임포트하세요:
    • sklearn.pipeline에서 make_pipeline.
    • sklearn.preprocessing에서 StandardScaler.
    • sklearn.cluster에서 KMeans.
  • StandardScaler의 인스턴스 scaler를 생성하세요.
  • 클러스터 수가 4인 KMeans 인스턴스 kmeans를 생성하세요.
  • scaler와 kmeans를 연결해 pipeline이라는 파이프라인을 만드세요. 이를 위해 둘을 make_pipeline()의 인자로 전달하면 됩니다.