1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Time K-fold

Pamiętasz konkurs „Store Item Demand Forecasting Challenge", w którym masz dostęp do danych sprzedaży w sklepach i musisz prognozować przyszłą sprzedaż?

To konkurs oparty na danych szeregów czasowych, dlatego należy zastosować czasową walidację krzyżową K-fold. Twoim zadaniem jest stworzenie tej strategii walidacji i sprawdzenie, czy działa poprawnie.

Zwróć uwagę, że DataFrame train jest już dostępny w twoim środowisku pracy, a klasa TimeSeriesSplit została zaimportowana z sklearn.model_selection.

Instrukcje

100 XP
  • Utwórz obiekt TimeSeriesSplit z 3 podziałami.
  • Posortuj dane treningowe według kolumny "date", aby zastosować czasowy K-fold.
  • Iteruj po każdym podziale czasowym, używając obiektu time_kfold.
  • Dla każdego podziału wybierz foldy treningowe i testowe, korzystając z train_index i test_index.