1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

Time K-fold

「Store Item Demand Forecasting Challenge」を覚えていますか?店舗×商品の売上データが与えられ、将来の売上を予測する課題です。

これは時系列データのコンペなので、time K-fold クロスバリデーションを適用する必要があります。ここでは、この検証戦略を作成し、期待どおりに動作することを確認しましょう。

なお、train データフレームはワークスペースにすでに用意されており、TimeSeriesSplit は sklearn.model_selection からインポート済みです。

指示

100 XP
  • 分割数を 3 として TimeSeriesSplit オブジェクトを作成します。
  • time K-fold を適用するために、学習データを "date" 列でソートします。
  • time_kfold オブジェクトを使って各時系列分割をループします。
  • 各分割で、train_index と test_index を使って学習用フォールドとテスト用フォールドを選択します。