1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích chuỗi thời gian bằng R

Connected

Bài tập

Giá trị thiếu

Đôi khi trong chuỗi thời gian có các giá trị bị thiếu, được ký hiệu là NA trong R, và việc biết vị trí của chúng rất hữu ích. Cũng quan trọng không kém là hiểu các hàm R xử lý giá trị thiếu như thế nào. Đôi khi bạn có thể muốn bỏ qua phần thiếu, nhưng những lúc khác bạn có thể muốn nội suy hoặc ước lượng các giá trị bị thiếu.

Hãy tiếp tục xem xét bộ dữ liệu theo tháng AirPassengers, nhưng giờ dữ liệu cho năm 1956 bị thiếu. Trong bài tập này, bạn sẽ khám phá tác động của phần dữ liệu thiếu này và nội suy một số giá trị mới để giải quyết vấn đề.

Hàm mean() tính trung bình mẫu, nhưng sẽ thất bại khi có bất kỳ giá trị NA nào. Dùng mean(___, na.rm = TRUE) để tính trung bình sau khi đã loại bỏ tất cả giá trị thiếu. Thực tế thường thay thế giá trị thiếu bằng trung bình của các giá trị quan sát được. Cách nội suy đơn giản này có vẻ đủ ổn khi áp dụng cho bộ dữ liệu AirPassengers không?

Hướng dẫn

100 XP
  • Dùng plot() để vẽ biểu đồ đơn giản của AirPassengers. Lưu ý dữ liệu bị thiếu cho năm 1956.
  • Dùng mean() để tính trung bình mẫu của AirPassengers với dữ liệu thiếu đã được loại bỏ (na.rm = TRUE).
  • Chạy đoạn mã có sẵn để nội suy (điền) giá trị trung bình vào phần dữ liệu bị thiếu.
  • Gọi plot() lần nữa để vẽ lại dữ liệu AirPassengers sau khi đã nội suy.
  • Chạy đoạn mã có sẵn để thêm dữ liệu AirPassengers đầy đủ vào biểu đồ của bạn.