1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

결측 유형 맞혀보기

결측값의 유형을 분석하면 결측 데이터를 가장 적절하게 처리하는 방법을 도출할 수 있어요. Pima Indians 당뇨병 데이터셋은 결측값이 있는 것으로 널리 알려져 있습니다. Pima Indians는 당뇨병에 더 취약한 것으로 알려진 소수 집단이에요. 이 데이터셋에는 이 공동체 구성원을 대상으로 수행한 여러 검사 결과가 담겨 있습니다.

영상 강의에서는 결측 패턴의 3가지 유형을 배웠습니다. 이번 연습 문제에서는 먼저 결측 요약을 시각화한 뒤, DataFrame에 어떤 결측 유형이 있는지 식별해 보겠습니다.

DataFrame은 이미 diabetes로 로드되어 있습니다.

출력을 더 쉽게 볼 수 있도록, plt.show() 대신 독자적인 display() 함수를 사용했습니다.

지침 1/2

undefined XP
    1
    2
  • missingno 패키지를 msno로 임포트하고, diabetes의 결측 요약을 그리세요.