1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R로 배우는 시계열 분석

Connected

Exercise

결측값

시계열 데이터에는 때때로 결측값이 존재하며, R에서는 NA로 표시돼요. 이 값들의 위치를 파악하는 것은 유용하고, 다양한 R 함수가 결측값을 어떻게 처리하는지도 아는 것이 중요합니다. 어떤 때는 결측을 무시하고 싶을 수 있지만, 다른 때는 결측값을 대치하거나 추정하고자 할 수도 있어요.

이번에는 월별 AirPassengers 데이터셋을 다시 살펴보되, 1956년의 데이터가 빠져 있다고 가정해 보겠습니다. 이 연습 문제에서는 이러한 결측이 어떤 의미를 가지는지 탐색하고, 문제를 해결하기 위해 일부 새 데이터를 대치해 보려고 합니다.

mean() 함수는 표본평균을 계산하지만, NA가 하나라도 있으면 계산에 실패해요. 결측값을 제거한 평균을 계산하려면 mean(___, na.rm = TRUE)를 사용하세요. 관측된 값들의 평균으로 결측을 대체하는 방법은 흔히 사용됩니다. 이런 단순한 대치 기법이 AirPassengers 데이터셋에 적용될 때 적절해 보이나요?

Instrukcje

100 XP
  • plot()을 사용해 AirPassengers의 단순 그래프를 표시하세요. 1956년의 결측 데이터를 확인해 보세요.
  • mean()을 사용해 결측 데이터를 제거한(na.rm = TRUE) AirPassengers의 표본평균을 계산하세요.
  • 미리 작성된 코드를 실행해 결측 구간에 평균값을 대치하세요.
  • plot()을 다시 호출해 대치가 완료된 새로운 AirPassengers 데이터를 다시 그리세요.
  • 미리 작성된 코드를 실행해 완전한 AirPassengers 데이터를 그래프에 추가하세요.