1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu chuỗi thời gian trong Python

Connected

Bài tập

Tổng tích lũy vs .diff()

Trong video, bạn đã học về cửa sổ mở rộng (expanding windows) cho phép chạy các phép tính tích lũy.

Thực tế, phương thức tính tổng tích lũy có tác dụng ngược lại với phương thức .diff() mà bạn đã gặp ở chương 1.

Để minh họa, hãy dùng chuỗi thời gian giá cổ phiếu Google, tạo hiệu giữa các mức giá, rồi dựng lại chuỗi bằng tổng tích lũy.

Hướng dẫn

100 XP

Chúng tôi đã nhập pandas dưới tên pd và matplotlib.pyplot dưới tên plt. Chúng tôi cũng đã nạp giá cổ phiếu Google vào biến data.

  • Áp dụng .diff() lên data, loại bỏ các giá trị thiếu, và gán kết quả cho differences.
  • Dùng .first('D') để chọn mức giá đầu tiên từ data, và gán cho start_price.
  • Dùng .append() để kết hợp start_price và differences, áp dụng .cumsum() và gán cho cumulative_sum.
  • Dùng .equals() để so sánh data và cumulative_sum, rồi in kết quả.