1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

अभ्यास

Gradient Boosting を基準としたベースライン

最後のベースラインを Random Forest で作ってみましょう。ビデオでは、グルーピングによるベースラインから Gradient Boosting に切り替えることでスコアが大きく改善しました。ここでは、sklearn の Random Forest を使って、さらにスコア向上を目指します。

この演習の目的は、数値特徴量を使ってチューニングなしの Random Forest モデルを学習することです。その後、テストデータに対して予測を行い、Public Leaderboard で結果を確認できます。なお、すでに "hour" という特徴量があり、これもモデルの入力として利用できます。

निर्देश

100 XP
  • 数値特徴量のリストに "hour" を追加します。
  • 数値特徴量を用いた学習データに対して、目的変数を "fare_amount" として RandomForestRegressor を学習させます。
  • 学習済みの Random Forest モデルでテストデータの予測を行います。