1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

결측 포함 산점도 생성하기

이 연습 문제에서는 결측값과 비결측값이 모두 포함된 산점도를 만들어 볼 거예요. 이전 연습 문제에서 작성한 fill_dummy_values() 함수를 활용해 DataFrame diabetes_dummy에 더미 값을 채워 넣습니다.

열의 결측 여부(nullity)는 .isnull() 메서드로 계산해요. 이 메서드는 True 또는 False 값의 Series(pd.Series)를 반환합니다.

결측과 비결측값에 서로 다른 색을 지정하려면, 플로팅할 두 열의 결측 여부를 OR(|) 연산으로 결합하면 됩니다. 그러면 다음과 같은 결과를 얻어요.

  • True \(\rightarrow\) col1 또는 col2 중 하나 이상이 결측이에요.
  • False \(\rightarrow\) col1과 col2 모두 결측이 아니에요.

DataFrame diabetes와 함수 fill_dummy_values()는 이미 로드되어 있어 바로 사용하실 수 있어요.

지침

100 XP
  • OR 연산을 사용해 Skin_Fold와 BMI의 결측 여부를 결합하세요.
  • 함수 fill_dummy_values()를 사용해 diabetes_dummy의 더미 값을 채우세요.
  • 'BMI' 대 'Skin_Fold'의 산점도를 생성하세요. 여기서 Y 대 X는 Y축 대 X축, 즉 X에 대한 Y를 의미합니다.