1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

標準化

正規化は、列を2つの基準点の間にスケーリングするのに便利ですが、どちらか一方でも外れ値の影響を強く受けていると、スケーリング後の2つの列を比較するのは難しくなります。これに対する一般的な解決策が標準化です。標準化では厳密な上下限を設ける代わりに、データを平均値の周りに中心化し、各データ点が平均から何標準偏差離れているかを計算します。

指示

100 XP
  • sklearn の preprocessing モジュールから StandardScaler をインポートします。
  • StandardScaler() を SS_scaler としてインスタンス化します。
  • so_numeric_df の Age 列に対して StandardScaler を fit します。
  • 直前に fit したスケーラーで同じ列を transform します。