1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 시계열 예측

Connected

연습 문제

계절성 방법의 예측 정확도 평가하기

1장에서도 배웠듯이, window() 함수는 인덱스 값이 아니라 실제 시점을 사용해 시계열의 start와 end를 지정해요. 이 두 인자 중 어느 것이든 ts()의 인자로도 사용했던 c(year, period) 형태의 벡터로 지정할 수 있어요. 여기서 period는 다시 quarter(분기)를 의미합니다.

이번에는 멜버른 분기별 방문자 수(visnights[, "VICMetro"])를 사용해 마지막 1년, 2년, 3년을 각각 제외한 세 가지 학습용 데이터셋을 만들 거예요. 연습 문제를 시작하기 전에 콘솔에서 미리 로드된 visnights 데이터를 살펴보세요. 이렇게 하면 예측 방법에서 예측할 값의 개수를 지정하는 키워드 h의 올바른 값을 정하는 데 도움이 됩니다.

그런 다음 각 학습용 데이터셋에 대해 다음 1년치 데이터를 예측하고, 마지막으로 accuracy()를 이용해 예측의 평균 절대 백분율 오차(MAPE)를 비교하세요. MAPE가 이렇게 크게 달라지는 이유가 무엇일지 생각해 보세요.

지침

100 XP
  • visnights[,"VICMetro"]에서 마지막 1년, 2년, 3년을 각각 제외해 window()로 세 가지 학습용 데이터셋을 만드세요. 이름은 각각 train1, train2, train3로 하세요. 이에 맞게 end 키워드를 설정하세요.
  • 각 학습용 데이터셋에 대해 snaive() 방법으로 1년치 예측을 계산하세요. 이름은 각각 fc1, fc2, fc3로 하세요.
  • 샘플 코드의 구조를 따라, accuracy() 함수를 사용해 세 가지 예측의 MAPE를 테스트 세트 기준으로 비교하세요.