1. Learn
  2. /
  3. Courses
  4. /
  5. Anomaly Detection in Python

Connected

Exercise

zスコアで外れ値を見つける

正規分布は自然界で広く見られる最も一般的な分布です。だからこそ、zスコア法は外れ値検出の手早い方法の一つになり得ます。

ビデオで紹介した経験則を思い出してください。標本が平均から標準偏差で3以上離れていれば、極端な値とみなせます。

ただし、zスコア法は慎重に使う必要があります。この方法は、データが正規分布に従うと自信を持って言える場合にのみ適切です。そうでないと、結果が誤解を招くことがあります。

prices の分布はあらかじめ読み込まれています。

Instructions

100 XP
  • 関連する scipy モジュールから zscore 関数をインポートします。
  • prices の zスコアを計算して scores に保存します。
  • scores の絶対値が 3 より大きいかを判定するブールマスク is_over_3 を作成します。
  • そのマスクを使って、外れ値となる prices を抽出します。