1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

演習

予測収益に対する Boosting

最初のモデルの RMSE はおよそ 7.34 でした。Boosting を1回適用して、これを改善できるか試してみましょう。

もう一度線形回帰を作成しますが、今回はターゲット値としてベースモデルの誤差を使います。計算は次のとおりです。

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

このモデルでは、'budget' 単体よりも情報量の多いパターンが得られることを期待して、代わりに 'popularity' 特徴量を使います。これは X_train_pop と X_test_pop として利用できます。前の演習と同様に、入力特徴量は標準化済みです。

指示

100 XP
  • X_train_pop と y_train_error を使って、前回の誤差に対して線形回帰モデルを学習させます。
  • テストセット X_test_pop 上で誤差の予測値を計算します。
  • 前の演習と同様に、y_test_error と pred_error を使って RMSE を計算します。