予測収益に対する Boosting

最初のモデルの RMSE はおよそ 7.34 でした。Boosting を1回適用して、これを改善できるか試してみましょう。

もう一度線形回帰を作成しますが、今回はターゲット値としてベースモデルの誤差を使います。計算は次のとおりです。

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

このモデルでは、'budget' 単体よりも情報量の多いパターンが得られることを期待して、代わりに 'popularity' 特徴量を使います。これは X_train_pop と X_test_pop として利用できます。前の演習と同様に、入力特徴量は標準化済みです。

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習