1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

사용자 지정 NA 값 설정

데이터 탐색과 정제의 일부는 누락값(NA)을 확인하고 이를 어떻게 처리할지 결정하는 일이에요. 누락값을 고유한 데이터 타입으로 다루면 더 수월하고, 이러한 NA 값을 겨냥하는 pandas 함수들도 있어요. pandas는 일부 값을 자동으로 누락으로 처리하지만, na_values 인수로 추가적인 NA 표시값을 전달할 수 있어요. 여기서는 Vermont 세금 데이터에서 잘못된 우편번호(ZIP code)가 NA로 인코딩되도록 설정해 보겠습니다.

pandas는 pd로 임포트되어 있어요.

지침

100 XP
  • 딕셔너리 null_values를 만들어 zipcode 열의 0이 NA 값으로 간주되도록 지정하세요.
  • vt_tax_data_2016.csv를 불러올 때 na_values 인수와 위 딕셔너리를 사용해 잘못된 ZIP 코드를 누락값으로 처리하세요.