1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶMachine Learningによる時系列データ解析

Connected

Bài tập

時間経過によるモデルスコアのばらつきを可視化する

各係数のばらつきを評価できたので、次はモデルの性能(スコア)でも同じことを行いましょう。TimeSeriesSplit オブジェクトは、各テストセットで時系列的に後ろのインデックスを使用します。つまり、検証で得られた「スコア」を時系列データとして扱えます。これを時間に沿って可視化すると、モデルの性能が時間とともにどう変化するかを確認できます。

線形回帰モデルのインスタンスは model、交差検証オブジェクトは cv、データは X と y に用意されています。

Hướng dẫn 1/2

undefined XP
    1
    2
  • データに対するモデルの交差検証スコアを計算します(用意したカスタムスコアラー my_pearsonr と cross_val_score を使用)。
  • 出力されたスコアを pandas の Series に変換し、時系列として扱えるようにします。
  • bootstrap_interval() を用いて、平均スコアのローリング信頼区間をブートストラップで推定します。