1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ予測入門

Connected

演習

SES と naive の比較

この演習では、Chapter 2 で学んだトレーニングセットとテストセット、subset() 関数、accuracy() 関数の知識を使って、marathon データに対する SES と naive の予測を比較します。

以前の演習「非季節モデルの予測精度を評価する」で、naive と mean の予測を比較したのととても似た手順です。

流れを確認しましょう。

  1. まずデータをインポートして読み込みます。どれだけをトレーニング用、どれだけをテスト用に割り当てるかを決めます。両者は重ならないようにします。
  2. データをサブセットしてトレーニングセットを作成します。これは予測関数の引数として使います。必要に応じて、後で使うテストセットも作成できます。
  3. 選んだ予測関数でトレーニングセットの予測を計算し、h を予測したい値の個数(テストセットの長さと同じ)に設定します。
  4. 結果を確認するには、accuracy() 関数を使い、予測を第1引数、元のデータ(またはテストセット)を第2引数に渡します。
  5. 出力の中から RMSE や MAE などの指標を選び、予測を評価します。誤差が小さいほど精度が高いことを示します。

marathon データはワークスペースに読み込まれています。

指示

100 XP
  • subset() を使って、marathon のうち最後の 20 年分をテスト用に残し、それ以外すべてを含むトレーニングセットを作成します。
  • このトレーニングセットに対して SES と naive の予測を計算し、それぞれ fcses と fcnaive に保存します。
  • コンソールで accuracy() 関数を使い、2 つの予測の精度指標を計算します。
  • テストセットの RMSE に基づいて、より良いほうの予測(fcses または fcnaive)を fcbest に代入します。