モデルの調整

極端に不均衡な不正検知データに対してランダムフォレストモデルを調整する簡単な方法は、sklearn のモデル定義時に class_weights オプションを使うことです。ただしご覧のとおり、やや大ざっぱな手段であり、特定のケースではうまく機能しないこともあります。

この演習では、前の演習で使った Random Forest モデルで weight = "balanced_subsample" モードを試します。データはすでに学習用とテスト用に分割済みで、X_train、X_test、y_train、y_test が利用できます。評価用のメトリクス関数もインポート済みです。