1. 学ぶ
  2. /
  3. コース
  4. /
  5. Anomaly Detection in Python

Connected

演習

IForest で外れ値を検出する

IForest は堅牢な推定器で、任意のデータセットから外れ値を検出するのに必要なコードはほんの数行です。sklearn の書き方にとても似ているため、見覚えがあると感じるかもしれません。

Big Mart Sales データの完全版が big_mart として読み込まれています。コンソールで中身を確認できます。

指示

100 XP
  • pyod から IForest 推定器をインポートします。
  • 既定のパラメータで IForest() を初期化します。
  • 推定器を big_mart に対して学習し、同時に予測を生成して、結果を labels に保存します。
  • pandas の部分選択を使って、big_mart から外れ値のみを抽出します。