1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

연습 문제

Time K-fold

가게-상품 판매 데이터가 주어지고, 향후 판매량을 예측해야 했던 "Store Item Demand Forecasting Challenge"를 기억하시나요?

이 대회는 시계열 데이터가 있는 문제예요. 따라서 time K-fold 교차 검증을 적용해야 합니다. 목표는 이 교차 검증 전략을 만들고, 기대한 대로 동작하는지 확인하는 것입니다.

train DataFrame은 이미 작업 공간에 준비되어 있고, sklearn.model_selection에서 TimeSeriesSplit이 임포트되어 있다는 점에 유의하세요.

지침

100 XP
  • 분할을 3개로 하여 TimeSeriesSplit 객체를 생성하세요.
  • time K-fold를 적용하기 위해 train 데이터를 "date" 열 기준으로 정렬하세요.
  • time_kfold 객체를 사용해 각 시점 분할을 순회하세요.
  • 각 분할마다 train_index와 test_index를 사용해 학습 폴드와 테스트 폴드를 선택하세요.