1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

数値特徴量の集約

多くの特徴量が似た値や関連する値を持つときは、集約統計量を用いて新しい特徴量を作成するのが有効です。ここでは running_times_5k というランタイムの DataFrame があります。データセット内の各 name について、5回の走行タイムの平均を求めてください。

指示

100 XP
  • .loc[] メソッドを使ってすべての行と対象の列を選択し、各列の .mean() を求めます。
  • DataFrame の .head() を表示して、mean 列を確認しましょう。