1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 시계열 예측

Connected

연습 문제

SES vs naive

이번 연습에서는 2장에서 배운 학습/테스트 세트, subset() 함수, accuracy() 함수를 활용해 marathon 데이터에 대해 SES와 naive 예측을 비교해 보겠습니다.

앞선 연습 문제 "비계절성 방법의 예측 정확도 평가"에서 naive와 평균 예측을 비교했던 것과 매우 유사합니다.

과정을 다시 정리하면 다음과 같습니다.

  1. 먼저 데이터를 불러옵니다. 학습과 테스트에 각각 얼마나 배분할지 정하고, 두 세트는 서로 겹치지 않게 합니다.
  2. 예측 함수의 인자로 사용할 학습용 세트를 만들기 위해 데이터를 부분 집합으로 나눕니다. 선택적으로, 이후에 사용할 테스트 세트도 만들 수 있습니다.
  3. 선택한 예측 함수로 학습 세트의 예측치를 계산하고, 예측할 값의 개수(테스트 세트의 길이와 동일)를 h로 설정합니다.
  4. 결과를 확인하려면 accuracy() 함수를 사용하세요. 첫 번째 인자는 예측치이고, 두 번째 인자는 원래 데이터(또는 테스트 세트)입니다.
  5. 출력 지표 중 RMSE나 MAE 등 하나를 선택해 예측을 평가합니다. 값이 작을수록 더 정확합니다.

marathon 데이터는 작업 공간에 로드되어 있습니다.

지침

100 XP
  • subset()을 사용해 marathon의 마지막 20년치를 테스트용으로 남기고, 나머지 전 기간을 학습 세트로 만드세요.
  • 이 학습 세트에 대해 SES와 naive 예측을 계산해 각각 fcses와 fcnaive에 저장하세요.
  • 콘솔에서 accuracy() 함수로 두 예측의 정확도 지표를 계산하세요.
  • 테스트 세트 기준 RMSE가 더 작은 쪽을 최적 예측으로 선택해 fcbest에 할당하세요.