1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

파일을 청크 단위로 가져오기

큰 파일을 다룰 때는 데이터를 여러 조각으로 나눠서 불러오고 처리하는 편이 더 수월할 수 있어요. 버몬트 주 세금 데이터를 가지고 이 워크플로를 연습해 보죠.

처음 500개 행은 vt_data_first500으로 로드되어 있어요. 이제 다음 500개 행을 가져오겠습니다. 이를 위해 몇 가지 키워드 인자를 사용해요. 올바른 레코드를 얻기 위한 nrows와 skiprows, 데이터에 열 이름이 없음을 pandas에 알리기 위한 header, 누락된 열 이름을 제공하기 위한 names가 필요해요. 또한 vt_data_first500에서 열 이름을 재사용할 수 있도록 list() 함수를 사용해 열 이름을 가져오세요.

pandas는 pd로 임포트되어 있어요.

지침

100 XP
  • nrows와 skiprows를 사용해 다음 500개 행으로 구성된 데이터프레임 vt_data_next500을 만드세요.
  • pandas가 헤더 행이 없다는 것을 알 수 있도록 header 인자를 설정하세요.
  • names 인자에 vt_data_first500의 열 목록을 리스트로 전달해 vt_data_next500의 열 이름을 지정하세요.