1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu chuỗi thời gian trong Python

Connected

Bài tập

Trung vị và độ lệch chuẩn lăn 360 ngày cho dữ liệu ozone NYC từ năm 2000

Video trước cũng cho bạn thấy cách tính nhiều thống kê lăn bằng .agg(), tương tự như .groupby().

Hãy xem kỹ hơn lịch sử chất lượng không khí của NYC với dữ liệu Ozone mà bạn đã gặp. Dữ liệu theo ngày biến động mạnh, nên dùng trung bình lăn dài hạn có thể giúp làm rõ xu hướng dài hạn.

Bạn sẽ dùng cửa sổ lăn 360 ngày và .agg() để tính trung bình và độ lệch chuẩn lăn cho giá trị ozone trung bình hằng ngày kể từ năm 2000.

Hướng dẫn

100 XP

Chúng tôi đã nhập pandas là pd, và matplotlib.pyplot là plt.

  • Dùng pd.read_csv() để nhập 'ozone.csv', tạo DateTimeIndex từ cột 'date' bằng parse_dates và index_col, gán kết quả cho data, và loại giá trị thiếu bằng .dropna().
  • Chọn cột 'Ozone' và tạo cửa sổ .rolling() với 360 kỳ, áp dụng .agg() để tính mean và std, và gán cho rolling_stats.
  • Dùng .join() để nối data với rolling_stats, và gán cho stats.
  • Vẽ stats bằng subplots.