클러스터링을 위한 물고기 데이터 스케일링

물고기의 측정값이 담긴 배열 samples가 제공됩니다. 각 행은 한 마리의 물고기를 나타냅니다. 그램 단위의 무게, 센티미터 단위의 길이, 높이 대비 길이의 백분율 같은 측정값은 서로 스케일이 많이 다릅니다. 이 데이터를 효과적으로 클러스터링하려면 먼저 이러한 특성들을 표준화해야 해요. 이번 연습에서는 데이터를 표준화하고 클러스터링하는 파이프라인을 만들어 보겠습니다.

이 물고기 측정 데이터는 Journal of Statistics Education에서 제공되었습니다.

다음을 임포트하세요:
- sklearn.pipeline에서 make_pipeline.
- sklearn.preprocessing에서 StandardScaler.
- sklearn.cluster에서 KMeans.
StandardScaler의 인스턴스 scaler를 생성하세요.
클러스터 수가 4인 KMeans 인스턴스 kmeans를 생성하세요.
scaler와 kmeans를 연결해 pipeline이라는 파이프라인을 만드세요. 이를 위해 둘을 make_pipeline()의 인자로 전달하면 됩니다.

연습 문제

클러스터링을 위한 물고기 데이터 스케일링

지침

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제