1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

연습 문제

결측값을 상수로 대체하기

결측 데이터를 완전히 제거하는 것이 많은 상황에서 올바른 접근일 수 있지만, 이렇게 하면 모델에서 많은 정보가 빠질 수 있어요.

설문에서 응답을 거부한 경우처럼, 범주형 열에서는 결측값 자체가 유효한 정보인 경우가 있어요. 이럴 때는 모든 결측값을 완전히 새로운 범주로 채울 수 있습니다. 예를 들어 'No response given'처럼요.

지침 1/2

undefined XP
    1
    2

so_survey_df의 Gender 열에서 각 범주의 발생 횟수를 출력하세요.