1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 ETL과 ELT

Connected

연습 문제

pandas로 결측값 채우기

데이터 파이프라인을 만들다 보면 결측값을 마주치는 것은 피할 수 없습니다. 어떤 경우에는 이런 레코드를 데이터셋에서 제거하면 됩니다. 하지만 다른 경우에는 누락된 정보를 보간해 값을 채워 넣어야 해요. 이 연습 문제에서는 pandas를 사용해 누락된 시험 점수를 보간하는 방법을 연습합니다.

"testing_scores.json" 파일의 데이터가 DataFrame으로 읽혀 raw_testing_scores 변수에 저장되어 있습니다. 또한 pandas는 pd로 불러와져 있습니다.

지침 1/3

undefined XP
    1
    2
    3
  • raw_testing_scores DataFrame의 head를 출력하고 NaN 값을 확인하세요.