1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu chuỗi thời gian trong Python

Connected

Bài tập

Tạo dữ liệu hàng tuần từ dữ liệu thất nghiệp theo tháng

Tỷ lệ thất nghiệp dân sự của Mỹ được báo cáo theo tháng. Đôi khi bạn cần dữ liệu có tần suất cao hơn — không vấn đề gì, vì bạn vừa học cách upsample một chuỗi thời gian.

Bạn sẽ làm việc với chuỗi thời gian của 20 năm gần đây, và áp dụng một vài tùy chọn để điền giá trị thiếu trước khi vẽ biểu đồ chuỗi hàng tuần.

Hướng dẫn

100 XP

Chúng tôi đã nhập sẵn pandas là pd và matplotlib.pyplot là plt.

  • Dùng pd.read_csv() để nhập 'unemployment.csv', tạo DateTimeIndex từ cột 'date' bằng parse_dates và index_col, và gán kết quả cho data.
  • Chuyển data sang tần suất hàng tuần bằng .asfreq() với bí danh 'W' và hiển thị 5 dòng đầu.
  • Chuyển tiếp sang tần suất hàng tuần, thêm tùy chọn 'bfill' và hiển thị 5 dòng đầu.
  • Tạo chuỗi hàng tuần, lần này thêm tùy chọn 'ffill', gán cho weekly_ffill và hiển thị 5 dòng đầu.
  • Vẽ weekly_ffill bắt đầu từ năm 2015.