1. 学ぶ
  2. /
  3. コース
  4. /
  5. Anomaly Detection in Python

Connected

演習

確率の集約としきい値処理

アンサンブルでは、さまざまな集約方法が利用できます。最も一般的なのは算術平均と中央値です。

ほとんどの場合は平均を使えますが、estimators に少なくとも3つ以上の分類器がある場合には中央値を使うのが適しています。

算術平均を使って、apple データセットから外れ値を除外しましょう。probability_scores と apple は前の演習から利用可能です。NumPy も読み込まれています。

指示

100 XP
  • probability_scores の行方向の平均を求めます。
  • 確率が 0.75 を超えるときに True となるブールマスクを作成します。
  • is_outlier マスクを使って外れ値を抽出します。