1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự báo bằng R

Connected

Bài tập

Biểu đồ chuỗi thời gian

Bước đầu tiên trong bất kỳ tác vụ phân tích dữ liệu nào là vẽ biểu đồ dữ liệu. Biểu đồ giúp bạn hình dung nhiều đặc điểm của dữ liệu, bao gồm các mẫu, điểm bất thường, thay đổi theo thời gian và mối quan hệ giữa các biến. Cũng giống như loại dữ liệu quyết định phương pháp forecasting nào được dùng, nó cũng quyết định loại biểu đồ nào là phù hợp.

Bạn có thể dùng hàm autoplot() để tạo time plot cho dữ liệu với hoặc không có facet (các ô hiển thị những tập con khác nhau của dữ liệu):

> autoplot(usnim_2002, facets = FALSE)

Cách trên là một trong nhiều phương thức trong khóa học này chấp nhận đối số kiểu boolean. Cả T và TRUE đều có nghĩa là "đúng", và F và FALSE nghĩa là "sai"; tuy nhiên, T và F có thể bị ghi đè trong mã của bạn. Vì vậy, bạn chỉ nên dựa vào TRUE và FALSE để thiết lập các cờ cho phần còn lại của khóa học.

Bạn sẽ dùng thêm hai hàm nữa trong bài tập này, which.max() và frequency().
which.max() có thể dùng để xác định chỉ số nhỏ nhất của giá trị lớn nhất

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Để tìm số lượng quan sát trên mỗi đơn vị thời gian, hãy dùng frequency(). Nhớ lại dữ liệu usnim_2002 từ bài trước:

> frequency(usnim_2002)
[1] 4

Vì khóa học này sử dụng các gói forecast và ggplot2, chúng đã được nạp sẵn vào không gian làm việc của bạn, cùng với myts từ bài trước và ba chuỗi sau (có trong gói forecast):

  • gold chứa giá vàng tính bằng đô la Mỹ
  • woolyrnq chứa thông tin về sản lượng sợi len ở Úc
  • gas chứa sản lượng khí đốt của Úc

Hướng dẫn

100 XP
  • Vẽ dữ liệu bạn đã lưu dưới tên myts bằng autoplot() với facetting.
  • Vẽ cùng dữ liệu đó nhưng không dùng facetting bằng cách đặt đối số phù hợp thành FALSE. Điều gì xảy ra?
  • Vẽ riêng từng chuỗi thời gian gold, woolyrnq và gas trong các biểu đồ tách biệt.
  • Dùng which.max() để phát hiện điểm ngoại lai trong chuỗi gold. Đó là quan sát nào?
  • Áp dụng hàm frequency() cho từng mặt hàng để lấy số quan sát trên mỗi đơn vị thời gian. Ví dụ, dữ liệu theo tuần sẽ trả về 52.