1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

標準化すべき特徴量の特定

この演習では、UFOデータセットの各列の分散を調べ、どの特徴量を標準化すべきかを判断します。seconds 列と minutes 列の分散を見ると、seconds 列の分散が極めて大きいことがわかります。seconds と minutes は互いに関連しているため(この問題はモデリング用に特徴量を選ぶときに扱います)、ここでは seconds 列を対数正規化してみましょう。

指示

100 XP
  • seconds 列と minutes 列の分散を計算し、結果をよく確認します。
  • seconds 列に対数正規化を行い、新しい列 seconds_log に変換します。
  • seconds_log 列の分散を出力します。