1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

연습 문제

모델 스태킹 I

이제 스태킹을 진행해 볼 차례예요. 스태킹을 구현하려면, 이전 영상에서 다룬 6단계를 따르면 됩니다:

  1. 학습 데이터를 두 부분으로 나눕니다.
  2. Part 1에 여러 모델을 학습시킵니다.
  3. Part 2에 대해 예측 값을 생성합니다.
  4. 테스트 데이터에 대해 예측 값을 생성합니다.
  5. Part 2의 예측 값을 특성으로 사용해 새로운 모델을 학습합니다.
  6. 2단계(메타) 모델을 사용해 테스트 데이터에 대한 예측 값을 생성합니다.

train과 test DataFrame은 워크스페이스에 이미 준비되어 있어요. features는 Part 1 데이터 학습에 사용할 열 이름 리스트이며, 역시 워크스페이스에 준비되어 있습니다. 타깃 변수 이름은 "fare_amount"입니다.

지침 1/2

undefined XP
    1
    2
  • train DataFrame을 동일한 크기의 두 부분 part_1과 part_2로 나누세요. test_size를 0.5로 설정해 train_test_split() 함수를 사용하세요.
  • part_1 데이터로 Gradient Boosting과 Random Forest 모델을 학습하세요.