1. Learn
  2. /
  3. Courses
  4. /
  5. Python에서 결측치 다루기

Connected

Exercise

MNAR 추론하기

이전 연습 문제에서는 결측치 요약을 바탕으로 결측 유형을 식별했어요. 이번 연습 문제에서는 그 흐름을 이어서, Not at Random 즉, 무작위가 아닌 방식으로 발생한 결측(MNAR)을 확실히 식별해 보겠습니다.

diabetes DataFrame의 결측치 요약은 아래와 같습니다.

목표는 diabetes DataFrame을 Serum_Insulin 기준으로 정렬하고, Skin_Fold와 Serum_Insulin 사이의 상관관계를 파악하는 것입니다.

출력을 더 쉽게 볼 수 있도록 plt.show() 대신 전용 display() 함수를 사용했습니다.

Instructions

100 XP
  • missingno 패키지를 msno로 임포트하세요.
  • diabetes에서 Serum_Insulin 열 값을 정렬하세요.
  • msno.matrix()로 Serum_Insulin의 결측치 요약을 시각화하세요.