1. Learn
  2. /
  3. Courses
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

Exercise

datetime 列の分析

特徴量エンジニアリングは、さまざまなデータ型から特徴量を加工するために、すべての Machine Learning のワークフローで重要なステップです。とくに、datetime 列は多くのデータセットで一般的です。この演習では、データセット内の hour 列を調べます。これは整数として保存されていますが、datetime を表しています。まず hour 列をパースして、datetime 列へ変換します。次に、その datetime 列から時(hour)を抽出し、その時刻ごとのクリック総数を計算します。

pandas モジュールは作業環境で pd として利用でき、サンプルの DataFrame は df として読み込まれています。

Instructions

100 XP
  • pd.to_datetime() を使って、hour 列を整数から datetime 列に変換します。
  • datetime アクセサ .dt を使い、変換後の列から .hour で時(hour)を抽出します。
  • 抽出した時刻ごとに .sum() を使ってクリック総数を計算します。