1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

삭제하시겠어요?

결측값을 완전히 삭제하기 전에, 삭제를 결정할 때 고려해야 할 요소들을 살펴봐야 합니다. 가장 간단한 요소는 결측 데이터의 크기예요. 결측에 영향을 미치는 더 복잡한 이유는 도메인 지식이 필요할 수도 있습니다. 이 연습 문제에서는 결측의 원인을 파악한 뒤, 그에 맞는 삭제 방법을 적용해 보겠습니다.

먼저 msno.matrix()와 msno.heatmap()으로 결측 현황과 결측이 있는 변수 간의 상관을 시각화합니다. 그다음 결측의 패턴을 판단하세요. 마지막으로 결측 유형에 따라 삭제 방법을 선택해 보겠습니다.

diabetes DataFrame은 미리 로드되어 있습니다.

출력을 더 쉽게 보실 수 있도록 plt.show() 대신 독점 display() 함수를 사용했습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • diabetes의 결측 매트릭스를 시각화하세요.