1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu bằng SQL

Connected

Bài tập

Khoảng thời gian tổng hợp tùy chỉnh

Tìm số trung vị của số lượng yêu cầu Evanston 311 mỗi ngày trong từng giai đoạn 6 tháng từ 2016-01-01 đến 2018-06-30. Hãy xây dựng truy vấn theo ba bước dưới đây.

Nhớ rằng để tổng hợp dữ liệu theo các khoảng ngày/giờ không tiêu chuẩn, như 6 tháng, bạn có thể dùng generate_series() để tạo các khoảng (bin) với cận dưới và cận trên theo thời gian, rồi tổng hợp các quan sát rơi vào từng khoảng.

Ghi nhớ: bạn có thể mở các slide có ví dụ về kiểu truy vấn này bằng biểu tượng PDF ở góc trên bên phải màn hình.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Dùng generate_series() để tạo các bin theo khoảng 6 tháng. Nhớ rằng giá trị cận trên của bin là loại trừ, nên các giá trị này cần lớn hơn một ngày so với ngày cuối cùng bạn muốn đưa vào bin.

    • Lưu ý trong mã mẫu, giá trị bin đầu tiên của cận trên là ngày 1 tháng 7, không phải ngày 30 tháng 6.
    • Dùng cách tương tự khi tạo các giá trị bin cuối cùng cho cận dưới và cận trên (tức là cho năm 2018).