1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

モデルのブレンディング

ここでは、ブレンディング手法を使ってモデルアンサンブルを作成します。

目的は、New York City Taxi コンペティションのデータに対して 2 つの異なるモデルを学習し、テストデータで予測を作成したあと、単純な算術平均でブレンドすることです。

train と test の各 DataFrame はワークスペースに用意されています。features は学習に用いる列名のリストで、同様に利用可能です。目的変数名は "fare_amount" です。

指示

100 XP
  • features リストを説明変数、"fare_amount" 列を目的変数として、学習データに Gradient Boosting モデルを学習させます。
  • 同様の手順で Random Forest モデルを学習させます。
  • 学習した Gradient Boosting と Random Forest の両モデルで、テストデータに対する予測を作成します。
  • 2 つのモデルの予測の平均を計算します。