1. 학습
  2. /
  3. 강의
  4. /
  5. 엔드 투 엔드 Machine Learning

Connected

연습 문제

클래스 불균형 찾기

지금은 Machine Learning 라이프사이클의 중요한 준비 단계인 탐색적 데이터 분석(EDA)에 집중하고 있어요.

EDA를 통해 heart_disease_df 데이터셋의 특성과 변수 간 관계를 더 잘 이해하고, 모델 학습으로 넘어가기 전에 해결해야 할 잠재적 문제를 파악할 수 있어요. 예를 들어 환자의 성별처럼, 피처에서 클래스의 분포를 파악하는 것은 EDA의 핵심 요소예요.

한 클래스의 샘플 수가 다른 클래스보다 훨씬 많은 클래스 불균형은 모델의 학습 과정을 편향시켜, 다수 클래스를 더 선호하는 문제를 일으킬 수 있어요.

지침

100 XP
  • sex 열의 클래스 분포를 출력하세요.