1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

연습 문제

K-means 클러스터링

Machine Learning 면접에서는 K-means 클러스터링의 출력이 알고리즘 성능을 평가하는 데 어떻게 쓰일 수 있는지 설명해 달라는 질문을 받을 수 있어요.

이번 연습 문제에서는 K-means 클러스터링을 실습합니다. 클러스터 개수 k가 다른 모델들을 .inertia_ 속성으로 비교하고, 다음 연습 문제에서 이 정보를 활용해 최적의 클러스터 수를 평가해 볼 거예요.

diabetes 데이터셋에서 타깃 변수는 progression임을 기억하세요.

현재 파이프라인에서의 위치:

Machine learning pipeline

지침 1/4

undefined XP
  • 1
    • 타깃 변수 progression을 제거해 특성 행렬 X를 만들고, 인스턴스화한 k-means 객체에 데이터를 적합하세요.
  • 2
    • 클러스터 5개의 k-means를 인스턴스화하고 inertia를 출력하세요.
  • 3
    • 특성 행렬을 클러스터 10개의 k-means에 적합하고 inertia를 출력하세요.
  • 4
    • 특성 행렬을 클러스터 20개의 k-means에 적합하고 inertia를 출력하세요.