1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự báo bằng R

Connected

Bài tập

Sai phân theo mùa để đạt tính dừng

Với dữ liệu có mùa vụ, người ta thường lấy sai phân giữa các quan sát ở cùng một mùa của các năm liên tiếp, thay vì giữa các kỳ liên tiếp. Ví dụ, với dữ liệu theo quý, bạn sẽ lấy chênh lệch giữa Q1 của một năm và Q1 của năm trước đó. Cách này gọi là sai phân theo mùa.

Đôi khi bạn cần áp dụng cả sai phân theo mùa và sai phân trễ 1 cho cùng một chuỗi, tức là tính sai phân của chính sai phân.

Trong bài tập này, bạn sẽ kết hợp sai phân và biến đổi để làm cho một chuỗi thời gian trông có tính dừng. Bộ dữ liệu ở đây là h02, chứa 17 năm doanh số thuốc corticosteroid theo tháng tại Australia. Dữ liệu đã được nạp vào không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Vẽ biểu đồ dữ liệu để quan sát xu hướng và mùa vụ.
  • Lấy log() của dữ liệu h02 rồi áp dụng sai phân theo mùa bằng cách dùng giá trị lag phù hợp trong diff(). Gán kết quả vào difflogh02.
  • Vẽ biểu đồ dữ liệu sau khi đã log và sai phân.
  • Vì difflogh02 vẫn có vẻ chưa dừng, hãy lấy thêm một sai phân trễ 1 bằng cách áp dụng diff() lên chính nó và lưu vào ddifflogh02. Vẽ chuỗi kết quả.
  • Vẽ ACF của chuỗi cuối cùng ddifflogh02 bằng hàm thích hợp.