1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ不正検知

Connected

演習

DBSCAN

この演習では、不正検知に 密度に基づくクラスタリング 手法(DBSCAN)を使ってみます。DBSCAN の利点は、事前にクラスタ数を指定する必要がない ことです。また、DBSCAN は K-means よりも非凸などのいびつな形状のデータをうまく扱えます。今回は、各クラスタの外れ値を不正とみなすのではなく、データの中で 最も小さいクラスタ を不正としてラベル付けします。スケーリング済みのデータセット X_scaled は今回も利用可能です。さっそく試してみましょう!

指示

100 XP
  • DBSCAN をインポートします。
  • 2 つのサンプル間の最大距離を 0.9、クラスタ内の最小観測数を 10 に設定して DBSCAN モデルを初期化し、スケーリング済みデータに適合させます。
  • 予測ラベル(各観測に割り当てられたクラスタ番号)を取得します。
  • クラスタ数と、その他の評価指標を出力します。