1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 시계열 예측

Connected

연습 문제

계절성이 있는 데이터에서 auto.arima()와 ets() 비교

연간보다 더 자주 관측되는 데이터에 대해 학습용/테스트용 세트를 만들려면 어떻게 해야 할까요? 필요하다면, window() 함수의 start 및/또는 end 인수에 c(year, period) 형태의 벡터를 사용할 수 있습니다. 또한 예측 함수에서 h 값을 알맞게 설정해야 합니다. h는 테스트 세트를 구성하는 데이터의 길이와 같아야 함을 기억하세요.

예를 들어, 데이터가 15년에 걸쳐 있고, 학습용 세트가 처음 10년이며, 마지막 5년을 예측하려면 테스트 세트에 월별 관측치 60개가 포함되므로 h = 5가 아니라 h = 12 * 5를 사용해야 합니다. 반대로 학습용 세트가 처음 9.5년이고 마지막 5.5년을 예측하려면, 추가 6개월을 고려해 h = 66을 사용합니다.

이 장의 마지막 연습 문제에서는 계절 ARIMA와 ETS 모형을 분기별 시멘트 생산량 데이터 qcement에 적용해 비교합니다. 계열이 매우 길기 때문에, 시계열 교차 검증 대신 학습용/테스트용 세트를 사용할 수 있습니다. 이 방법이 훨씬 빠릅니다.

qcement 데이터는 작업 공간에서 바로 사용할 수 있습니다.

지침

100 XP
  • 1988년부터 시작해서 2007년 4분기까지의 qcement 데이터 20년치를 포함하는 학습용 세트 train을 만드세요. end에는 벡터를 사용해야 합니다. 나머지 데이터는 테스트 세트입니다.
  • 학습용 데이터에 ARIMA와 ETS 모형을 적합하고 각각 fit1, fit2에 저장하세요.
  • 이전 연습 문제에서 했던 것처럼, 두 모형 모두 잔차가 백색잡음인지 확인하세요.
  • 두 모형에서 남은 기간에 대한 예측을 각각 fc1, fc2로 생성하세요. h는 테스트 세트의 전체 분기 수로 설정하세요. 주의: qcement의 마지막 관측치는 해당 연도의 마지막 분기가 아닙니다!
  • accuracy() 함수를 사용해 RMSE 값을 기준으로 더 나은 모형을 찾고, 이를 bettermodel로 저장하세요.