1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

日付に基づくベースライン

すでに 3 つの異なるベースラインモデルを作成しました。さらに練習するために、もう少し作ってみましょう。最初のモデルはグルーピング変数に基づきます。時間帯によって乗車料金が変わることは明らかです。たとえば、ラッシュアワーは料金が高くなるかもしれません。

今回の目標は、該当する時間ごとに平均の "fare_amount" を割り当てるベースラインモデルを作ることです。まずは train 全体でモデルを作成し、test データセットに対して予測を行います。

train と test の各 DataFrame はワークスペースに用意されています。さらに、両方の DataFrame にある "pickup_datetime" 列は、すでに datetime オブジェクトに変換済みです。

指示

100 XP
  • train および test の各 DataFrame で、"pickup_datetime" 列から時(hour)を取得します。
  • train データで、時間ごとの平均 "fare_amount" を計算します。
  • 得られたグルーピングを使い、pandas の map() メソッドで test の予測を作成します。
  • 予測結果をファイルに書き出します。