예상 수익에 대한 Boosting

초기 모델의 RMSE는 대략 7.34였습니다. 이제 boosting을 한 번 적용해 성능을 더 높일 수 있는지 확인해 볼게요.

이번에는 또 다른 선형 회귀를 만들되, 타깃 값은 다음과 같이 기준(base) 모델의 오차로 설정합니다:

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

이 모델에서는 'budget'만 사용할 때보다 더 유용한 패턴을 제공할 수 있기를 기대하며, 대신 'popularity' 특성을 사용할 거예요. 이는 X_train_pop과 X_test_pop으로 제공됩니다. 이전 연습 문제와 마찬가지로 입력 특성은 이미 표준화되어 있어요.

X_train_pop과 y_train_error를 사용해 이전 오차에 대해 선형 회귀 모델을 학습하세요.
테스트 세트 X_test_pop에서 예측된 오차를 계산하세요.
이전 연습 문제와 같이 y_test_error와 pred_error를 사용해 RMSE를 계산하세요.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제