곡물 클러스터링 평가하기

이전 연습 문제에서 관성(inertia) 플롯을 보고, 곡물 데이터에 대해 클러스터 수 3이 적절하다는 것을 확인했어요. 실제로 이 곡물 샘플은 "Kama", "Rosa", "Canadian"의 3가지 서로 다른 품종이 섞여 있습니다. 이번 연습에서는 곡물 샘플을 세 개의 클러스터로 묶고, 교차표를 통해 클러스터와 품종을 비교해 보세요.

곡물 샘플이 담긴 배열 samples와, 각 샘플의 품종을 나타내는 리스트 varieties가 주어져 있습니다. Pandas(pd)와 KMeans는 이미 임포트되어 있어요.

클러스터 수가 3인 KMeans 모델 model을 만드세요.
model의 .fit_predict() 메서드를 사용해 samples에 학습시키고 클러스터 레이블을 도출하세요. .fit_predict()는 .fit() 후 .predict()를 호출하는 것과 같습니다.
두 개의 열 'labels'와 'varieties'를 갖는 DataFrame df를 labels와 varieties를 각각 열 값으로 사용해 만드세요. 이 부분은 이미 준비되어 있습니다.
pd.crosstab()을 df['labels']와 df['varieties']에 적용해 각 클러스터 레이블과 품종이 일치한 횟수를 계산하고, 결과를 ct에 할당하세요.
완료되면 제출을 눌러 교차표를 확인하세요!

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제