1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Mixture Models

Connected

연습 문제

클러스터 시각화하기

지금까지 우리는 관측값과 함께 클러스터를 나타내는 타원까지 한 그림에 표시하는 데 필요한 모든 것을 준비했어요.

또한 두 개의 클러스터 중 하나로 각 관측값을 할당하려면 clusters() 함수를 사용해 실제 레이블과 결과를 비교할 수 있어요. 상기하자면, 변수 Weight만 사용해서 데이터를 클러스터링했을 때는 여성 4500명과 남성 4556명을 정확히 예측했어요. 이제 추가 변수를 포함했을 때 클러스터를 더 잘 분리할 수 있는지 확인해 봅시다.

지침

100 XP
  • geom_point()를 사용해 Weight와 BMI의 산점도를 만드세요. 여기에 geom_path() 함수로 ellipses_comp_number에 저장된 두 개의 타원을 추가하세요.
  • 타원은 데이터 프레임으로 변환되어야 해요.
  • 클러스터 1은 빨간색, 클러스터 2는 파란색으로 색을 지정하세요.
  • 변수 Gender에 저장된 실제 레이블과 clusters로 추정한 예측 레이블의 교차표(빈도표)를 계산하세요.