1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

연습 문제

Model stacking II

지금까지 스태킹을 구현하면서 다음을 수행했어요:

  1. 학습 데이터를 두 부분으로 분할
  2. 1부분(Part 1)에서 여러 모델 학습
  3. 2부분(Part 2)에서 예측 생성
  4. 테스트 데이터에서 예측 생성

이제 목표는 3번과 4번 단계에서 얻은 예측값을 피처로 사용해 2단계 모델을 만드는 것입니다. 이 모델은 Part 2 데이터로 학습하고, 이후 테스트 데이터에 대해 스태킹 예측을 만들 수 있어요.

part_2와 test DataFrame은 워크스페이스에 준비되어 있습니다. Gradient Boosting과 Random Forest의 예측값은 각각 "gb_pred"와 "rf_pred"라는 이름으로 이들 DataFrame에 저장되어 있어요.

지침

100 XP
  • Gradient Boosting과 Random Forest 모델의 예측값을 피처로 사용하여 Part 2 데이터에 Linear Regression 모델을 학습하세요.
  • Gradient Boosting과 Random Forest 모델의 예측값을 피처로 사용하여 테스트 데이터에 대해 예측을 생성하세요.