1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ不正検知

Connected

演習

ROS と RUS の組み合わせ

クラス分布をバランスさせるために、random over-sampling (ROS) と random under-sampling (RUS) を組み合わせることができます。ここでは、新しいデータセットが 10,000 件の取引を含み、そのうち 30% が不正取引になるように再バランスします。

必要に応じて、コンソールで ROSE を読み込み、?ovun.sample と入力すると、この関数が受け取る引数を確認できます。

指示

100 XP
  • ROSE パッケージを読み込みます。
  • n_new を 10,000、fraud_fraction を 30% に設定します。
  • オーバーサンプリングとアンダーサンプリングの両方を使います。
  • アンダーサンプリング後のデータセットのクラスバランスを確認します。