1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 앙상블 기법

Connected

연습 문제

CatBoost로 영화 수익 예측하기

이제 boosting 챕터를 마무리하면서 movies 데이터셋으로 돌아와 볼게요! 이 연습 문제에서는 로그 수익을 예측하기 위해 CatBoostRegressor를 만들어 보겠습니다. 지금까지 가장 성능이 좋았던 모델은 RMSE가 5.15인 AdaBoost 모델이었습니다.

CatBoost가 AdaBoost를 뛰어넘을 수 있을까요? 공정한 비교를 위해 비슷한 하이퍼파라미터를 사용해 보겠습니다.

지금까지 사용한 특성은 다음과 같습니다: 'budget', 'popularity', 'runtime', 'vote_average', 'vote_count'. catboost는 cb로 임포트되어 있습니다.

주의: 분류기(classifier)를 사용하지 않도록 조심하세요. 잘못 사용하면 세션이 만료될 수 있습니다!

지침

100 XP
  • 100개의 estimator, 학습률 0.1, 최대 깊이 3을 사용해 CatBoostRegressor를 구성하고 학습하세요.
  • 테스트 세트에 대한 예측값을 계산하고 RMSE를 출력하세요.