결측값

시계열 데이터에는 때때로 결측값이 존재하며, R에서는 NA로 표시돼요. 이 값들의 위치를 파악하는 것은 유용하고, 다양한 R 함수가 결측값을 어떻게 처리하는지도 아는 것이 중요합니다. 어떤 때는 결측을 무시하고 싶을 수 있지만, 다른 때는 결측값을 대치하거나 추정하고자 할 수도 있어요.

이번에는 월별 AirPassengers 데이터셋을 다시 살펴보되, 1956년의 데이터가 빠져 있다고 가정해 보겠습니다. 이 연습 문제에서는 이러한 결측이 어떤 의미를 가지는지 탐색하고, 문제를 해결하기 위해 일부 새 데이터를 대치해 보려고 합니다.

mean() 함수는 표본평균을 계산하지만, NA가 하나라도 있으면 계산에 실패해요. 결측값을 제거한 평균을 계산하려면 mean(___, na.rm = TRUE)를 사용하세요. 관측된 값들의 평균으로 결측을 대체하는 방법은 흔히 사용됩니다. 이런 단순한 대치 기법이 AirPassengers 데이터셋에 적용될 때 적절해 보이나요?