1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu chuỗi thời gian trong Python

Connected

Bài tập

Các phân vị dạng rolling cho chất lượng không khí hằng ngày ở NYC

Ở video trước, bạn đã học cách tính các phân vị rolling để mô tả sự thay đổi về độ phân tán của chuỗi thời gian theo thời gian theo cách ít nhạy với ngoại lệ hơn so với dùng trung bình và độ lệch chuẩn.

Hãy tính các phân vị rolling — 10%, 50% (trung vị) và 90% — của phân phối nồng độ ozone trung bình theo ngày ở NYC bằng cửa sổ rolling 360 ngày.

Hướng dẫn

100 XP

Chúng ta đã nhập pandas là pd và matplotlib.pyplot là plt. Dữ liệu ozone từ 2000–2017 cũng đã được nạp vào biến data.

  • Áp dụng .resample() với tần suất ngày 'D' cho data và dùng .interpolate() để điền giá trị khuyết, rồi gán lại vào data.
  • Kiểm tra kết quả bằng .info().
  • Tạo một cửa sổ .rolling() với 360 kỳ, chọn cột 'Ozone', và gán kết quả vào rolling.
  • Chèn ba cột mới, 'q10', 'q50' và 'q90' vào data, tính các phân vị tương ứng từ rolling.
  • Vẽ data.