1. Learn
  2. /
  3. Courses
  4. /
  5. Anomaly Detection in Python

Connected

Exercise

外れ値確率を用いた KNN

contamination を使った場合、その出力だけを完全には信用できません。そこで、より信頼できる外れ値確率で検証してみましょう。

データセットは females として読み込まれており、KNN 推定器もインポート済みです。

Instructions

100 XP
  • 近傍数を 20 として KNN をインスタンス化します。
  • 外れ値確率を計算します。
  • 外れ値確率が 55% を超えるところが True になるブールマスクを作成します。
  • is_outlier を使って、females から外れ値を抽出します。