1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 군집 분석

Connected

연습 문제

클러스터 기본 점검

FIFA 18 데이터셋에서, 이전 연습 문제들에서는 수비수에 집중했어요. 이번에는 선수의 공격 속성에 주목해 보겠습니다. Pace(pac), Dribbling(dri), Shooting(sho)는 공격형 선수에게서 두드러지는 특징입니다. 이 연습에서는 이미 이 세 속성의 스케일링된 값을 사용해 k-평균 클러스터링을 적용해 두었습니다. 이렇게 만들어진 클러스터에 대해 기본적인 점검을 해 보세요.

데이터는 pandas DataFrame인 fifa에 저장되어 있습니다. 스케일링된 열 이름은 리스트 scaled_features에 들어 있습니다. 클러스터 레이블은 cluster_labels 열에 저장되어 있습니다. pandas의 .count()와 .mean() 메서드는 DataFrame에서 관측치의 개수와 평균을 구하는 데 도움이 된다는 점을 떠올려 보세요.

지침

100 XP
  • cluster_labels 열로 그룹화하여 각 클러스터의 크기를 출력하세요.
  • 각 클러스터에서 선수들의 임금 평균을 출력하세요. 선수의 유로화 임금이 저장된 열 이름은 eur_wage입니다.