1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ異常検知入門

Connected

演習

特徴量の標準化

kNN 距離を計算する前に、scale() 関数を使って特徴量の入力を標準化しておくことが重要です。標準化により、平均や分散が大きい特徴量が kNN 距離スコアに過度な影響を与えないようにできます。

指示

100 XP
  • summary() 関数を wine データに適用し、pH と alcohol の平均、最小値、最大値を確認します。
  • scale() 関数を使って、wine の標準化版データ wine_scaled を作成します。
  • summary() 関数を wine_scaled に適用し、平均値や範囲が変化していることを確認します。