1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

Exercise

불균형 클래스 지표

클래스 불균형은 어떤 Machine Learning 맥락에서도 모델 성능을 저해할 수 있어요. 특히 보험 사기 데이터처럼 설계상 불균형한 데이터가 있는 경우가 많기 때문에, 면접에서 불균형 클래스를 가진 데이터셋을 받았을 때 어떤 조치를 할지 질문받는 일이 흔합니다.

이번 연습에서는 sklearn을 사용해 로지스틱 회귀 모델을 만들고, 혼동 행렬과 여러 평가 지표를 출력해 클래스 불균형이 있는 데이터셋에서 Machine Learning 모델을 어떻게 해석해야 하는지 더 잘 이해해 보겠습니다.

앞서 loan_data에서 보았던 클래스 불균형을 떠올려 보세요. Fully Paid(완납) 상태의 관측치가 Charged Off(상각)보다 훨씬 많았습니다:

Class imbalance

Инструкции 1 / 4

undefined XP
    1
    2
    3
    4
  • 로지스틱 회귀 모델 생성과 혼동 행렬, 정확도, 정밀도(precision), 재현율(recall), F1-점수를 위한 필요한 모듈을 임포트하세요.