1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Kết hợp, lọc và tổng hợp

Trong bài tập này, bạn sẽ vận dụng những gì đã học để xây dựng một tập dữ liệu nhằm khảo sát cách số lượng khiếu nại về sưởi ấm gửi đến đường dây 311 của New York thay đổi theo nhiệt độ.

Bên cạnh bảng hpd311calls, tệp data.db còn có bảng weather với số liệu nhiệt độ cao nhất và thấp nhất theo ngày cho NYC. Mục tiêu là lấy số cuộc gọi về heat/hot water mỗi ngày và ghép kèm nhiệt độ. Việc này có thể thực hiện trong một truy vấn duy nhất, và chúng ta sẽ xây dựng theo từng phần.

Ở phần một, ta sẽ chỉ lấy dữ liệu cần thiết từ hpd311calls. Sau đó, ở phần hai, ta sẽ chỉnh sửa truy vấn để JOIN với dữ liệu weather.

pandas đã được import với tên pd, và đối tượng engine kết nối cơ sở dữ liệu đã được tạo là engine.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Hoàn thiện truy vấn để lấy created_date và số lượng bản ghi có complaint_type là HEAT/HOT WATER từ hpd311calls theo ngày.
  • Tạo một dataframe df chứa kết quả truy vấn.