1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Time K-fold

Vzpomínáš na soutěž „Store Item Demand Forecasting Challenge", kde dostaneš data o prodejích v obchodech a máš za úkol předpovědět budoucí tržby?

Jde o soutěž s časovými řadami, takže je vhodné použít křížovou validaci time K-fold. Tvým cílem je tuto strategii křížové validace vytvořit a ověřit, že funguje správně.

DataFrame train je v tvém prostředí už k dispozici a TimeSeriesSplit byl naimportován z sklearn.model_selection.

Pokyny

100 XP
  • Vytvoř objekt TimeSeriesSplit se 3 rozděleními.
  • Seřaď trénovací data podle sloupce "date", aby bylo možné aplikovat time K-fold.
  • Projdi každé časové rozdělení pomocí objektu time_kfold.
  • Pro každé rozdělení vyber trénovací a testovací část dat pomocí train_index a test_index.