1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

일부 열만 가져오기

Vermont 세금 데이터에는 우편번호와 소득 구간별로 가구 구성, 소득원, 납부 세금을 설명하는 147개의 열이 있어요. 대부분의 분석에는 모든 열이 필요하지 않죠. 이 연습에서는 read_csv()의 usecols 인수를 사용해 변수를 줄인 데이터프레임을 만들어 보겠습니다.

지리와 소득 수준에 따라 가구 구성이 다른지 살펴보려고 해요. 이를 위해 소득 구간, 우편번호(ZIP code), 세금 신고 형태(예: 미혼 또는 기혼), 부양가족 수에 대한 열이 필요합니다. 이 데이터는 변수명을 코드로 사용하므로, 필요한 구체적인 열은 지침에 제공되어 있어요.

pandas는 이미 pd로 임포트되어 있습니다.

지침

100 XP
  • 사용할 열 목록을 만드세요: zipcode, agi_stub(소득 구간), mars1(미혼 가구 수), MARS2(기혼으로 신고한 가구 수), NUMDEP(부양가족 수).
  • 선택한 열만 사용하여 vt_tax_data_2016.csv에서 데이터프레임을 만드세요.