1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

조인, 필터링, 그리고 집계

이번 연습에서는 지금까지 배운 내용을 활용해, 뉴욕시 311에 접수된 난방 관련 민원 수가 기온에 따라 어떻게 달라지는지 조사할 수 있는 데이터셋을 만들어 볼 거예요.

hpd311calls 테이블 외에, data.db에는 NYC의 일별 최고/최저 기온이 담긴 weather 테이블이 있어요. 각 날짜별로 HEAT/HOT WATER 민원 건수와 해당 날짜의 기온을 함께 가져오려 합니다. 이는 하나의 쿼리로 수행할 수 있으며, 단계별로 만들어 보겠습니다.

1단계에서는 hpd311calls에서 필요한 데이터만 가져오고, 2단계에서는 쿼리를 수정해 weather 데이터를 조인하겠습니다.

pandas는 pd로 임포트되어 있고, 데이터베이스 엔진은 engine으로 생성되어 있어요.

지침 1/2

undefined XP
    1
    2
  • 날짜별로 hpd311calls에서 complaint_type이 HEAT/HOT WATER인 레코드의 개수를 집계하고, created_date와 함께 가져오도록 쿼리를 완성하세요.
  • 쿼리 결과로 데이터프레임 df를 만드세요.