1. 学ぶ
  2. /
  3. コース
  4. /
  5. Anomaly Detection in Python

Connected

演習

QuantileTransformer を試す

標準化は z スコアと同じ落とし穴にはまりやすいです。どちらも平均と標準偏差を用いて計算するため、極端な値に非常に敏感です。

この問題を回避するには、分位点を使う QuantileTransformer を使うとよいです。分布の分位点は、外れ値の大きさにかかわらず同じままです。

データが正規分布に従う(ヒストグラムで確認できます)場合は StandardScaler を使うべきです。それ以外の分布では、QuantileTransformer のほうが適しています。

読み込まれている females データセットで練習します。matplotlib.pyplot は標準のエイリアス plt で読み込まれています。

指示

100 XP
  • 特徴量を正規分布に変換する QuantileTransformer() をインスタンス化し、qt に代入します。
  • 特徴量配列 X に対してフィットして変換し、列名を保持します。
  • palmlength 列のヒストグラムを描画します。