1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Machine Learning 특성 공학

Connected

연습 문제

내 데이터는 얼마나 희소할까요?

대부분의 데이터셋에는 결측값이 있으며, 종종 NaN(Not a Number)으로 표시됩니다. Pandas를 사용하면 각 열에 결측값이 얼마나 있는지 쉽게 확인할 수 있어요.

설문에 참여한 개발자 중 나이를 입력한 사람(so_survey_df의 Age 열)과 성별을 입력한 사람(so_survey_df의 Gender 열)이 각각 얼마나 되는지 확인해 보세요.

지침 1/2

undefined XP
    1
    2
  • DataFrame에서 'Age'와 'Gender' 열만 선택해 부분 집합을 만드세요.
  • 두 열의 결측이 아닌 값 개수를 출력하세요.