1. 学ぶ
  2. /
  3. コース
  4. /
  5. End-to-End Machine Learning

Connected

演習

正規化と標準化

特徴量のスケーリングは、モデリングの際に特定の特徴量だけが支配的にならないようにするために重要です。Normalization(正規化)とStandardization(標準化)は広く使われるスケーリング手法です。正規化は通常、特徴量を [0, 1] の範囲に収め、概ね同じスケールにします。標準化は、平均0・分散1になるようにデータを変換し、外れ値に関する情報をより保持しつつ、値の範囲を境界づけません。matplotlib.pyplot は plt として、MinMaxScaler と StandardScaler はインポート済みで、心臓病データの分割後の特徴量は X_train と X_test として読み込まれています。

指示1 / 3

undefined XP
  • 1
    • age の初期分布をプロットします。
  • 2
    • age 特徴量を正規化してプロットします。
  • 3
    • age 特徴量を標準化してプロットします。