1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

연습 문제

모델 블렌딩

이제 블렌딩 기법으로 모델 앙상블을 만들어 보겠습니다.

목표는 New York City Taxi 대회의 데이터를 사용해 서로 다른 2개의 모델을 학습하고, 테스트 데이터에 대한 예측을 만든 다음 간단한 산술 평균으로 블렌딩하는 것입니다.

train과 test DataFrame은 작업 공간에 이미 준비되어 있습니다. features는 학습에 사용할 열 이름 목록이며 작업 공간에 제공되어 있습니다. 타깃 변수 이름은 "fare_amount"입니다.

지침

100 XP
  • features 목록을 사용하고 타깃 변수로 "fare_amount" 열을 지정해 train 데이터에 Gradient Boosting 모델을 학습하세요.
  • 같은 방식으로 Random Forest 모델을 학습하세요.
  • Gradient Boosting과 Random Forest 모델을 사용해 test 데이터에 대한 예측을 만드세요.
  • 두 모델의 예측값 평균을 구하세요.