1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

불량 데이터 건너뛰기

이번 연습에서는 read_csv()의 매개변수를 사용해 열 수보다 값이 더 많은 레코드처럼 불량 데이터가 있는 파일을 처리해 볼 거예요. 기본적으로 이런 파일을 가져오면 pandas.errors.ParserError라는 특정 오류가 발생해요.

여기 있는 Vermont 세금 데이터에는 일부 줄이 손상되어 있어요. 정상적인 줄만 불러오려면 pandas에 오류가 나오는 줄을 건너뛰라고 알려줘야 해요. 또한 어떤 줄이 건너뛰어졌는지 알 수 있도록 경고도 받으면 좋아요.

pandas는 이미 pd로 임포트되어 있어요. 연습용 코드는 파일을 읽으려고 시도하며, pandas.errors.ParserError가 발생하면 except 블록의 코드가 실행돼요.

지침 1/3

undefined XP
  • 1

    키워드 인수 없이 vt_tax_data_2016_corrupt.csv 파일을 가져와 보세요.

  • 2

    불량 레코드를 건너뛰도록 error_bad_lines 매개변수를 설정해 vt_tax_data_2016_corrupt.csv를 가져오세요.

  • 3

    불량 레코드를 건너뛸 때마다 경고를 표시하도록 warn_bad_lines 매개변수를 설정해 가져오기를 업데이트하세요.