1. 学习
  2. /
  3. 课程
  4. /
  5. Pythonで学ぶ不正検知

Connected

练习

モデルの調整

極端に不均衡な不正検知データに対してランダムフォレストモデルを調整する簡単な方法は、sklearn のモデル定義時に class_weights オプションを使うことです。ただしご覧のとおり、やや大ざっぱな手段であり、特定のケースではうまく機能しないこともあります。

この演習では、前の演習で使った Random Forest モデルで weight = "balanced_subsample" モードを試します。データはすでに学習用とテスト用に分割済みで、X_train、X_test、y_train、y_test が利用できます。評価用のメトリクス関数もインポート済みです。

说明

100 XP
  • 分類器の class_weight 引数を balanced_subsample に設定します。
  • 学習用データでモデルを学習させます。
  • X_test から予測と確率を取得します。
  • roc_auc_score、分類レポート、混同行列を取得します。