1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Bài tập

실루엣 방법

이전 레슨에서는 클러스터 수에 따라 K-Means 알고리즘의 성능이 어떻게 달라지는지 살펴봤어요. 인터뷰 상황에서는 최적의 클러스터 수를 찾는 것이 최선의 결과를 내는 데 특히 중요합니다.

이번 연습 문제에서는 sklearn.metrics의 silhouette_score() 함수를 사용해 diabetes DataFrame에 대해 실행한 K-Means 결과에 실루엣 방법을 적용해 최적의 클러스터 수를 찾아볼 거예요. 점수를 계산할 때는 유클리드 거리(euclidean distance)를 사용해 Elbow 방법과 비교 가능하도록 합니다.

K-Means 모델을 학습하는 데 사용할 특성 행렬 X는 미리 생성되어 있어요.

이전 연습과 동일한 파이프라인 단계에 있으며, 여기에 예측 단계가 추가됩니다: Machine learning pipeline

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • K-Means 알고리즘을 인스턴스화하고 실루엣 점수를 계산하는 데 필요한 모듈을 임포트하세요.