1. 学习
  2. /
  3. 课程
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

练习

日付特徴量

これまでに数値変数を使って基本的な特徴量を作成しました。次は、日付と時刻に基づく特徴量を作成していきます。ここでは Kaggle の Taxi Fare Prediction コンペティションのデータからサブサンプルを使います。データはタクシー乗車に関する情報で、各乗車の料金を予測することが目的です。

目標は、pickup の日時から日付系の特徴量を作成することです。学習用とテスト用のデータには、可能であれば同時に新しい特徴量を作成するのが望ましいことを思い出してください。特徴量を作成したら、データを train と test の DataFrame に分割し直します。ここでは pandas の isin() メソッドを使って分割します。

train と test の DataFrame はすでにワークスペースに用意されています。

说明

100 XP
  • train と test の DataFrame を連結して、単一の DataFrame taxi を作成します。
  • 「pickup_datetime」列を datetime オブジェクトに変換します。
  • 「pickup_datetime」列から、曜日(.dayofweek 属性)と時(.hour 属性)の特徴量を作成します。