1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ不正検知

Connected

演習

外れ値の検出

次の演習では、K-means アルゴリズムで不正を予測し、保存されている実際のラベルと比較して結果の妥当性を確認します。

不正な取引は、通常、クラスタのセントロイドから最も離れた観測としてフラグ付けされます。この演習では、その方法とカットオフの決め方を学びます。次の演習で結果を確認します。

スケーリング済みの観測値 X_scaled と、変数 y に保存されたラベルが利用できます。

指示

100 XP
  • スケーリング済みデータとラベル y を学習用とテスト用に分割します。
  • 3 クラスタの MiniBatch K-means モデルを定義し、学習用データにフィットさせます。
  • テストデータからクラスタ予測を取得し、クラスタのセントロイドを得ます。
  • 不正と非不正の境界を、距離分布の 95% 以上に設定します。