1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶ不正検知

Connected

Exercise

多数派クラスを縮小する

データセット内の詐欺ケースを増やす代わりに、正当なケースをランダムに削除してバランスを取ることもできます。creditcard データセットで多数派クラス(Class = 0)をアンダーサンプリングしてみましょう。コンソールで table() を使うと、詐欺と正当な取引がそれぞれ何件あるかを確認できます。

Instructions

100 XP
  • ROSE ライブラリを読み込みます。
  • アンダーサンプリング後のデータセットで詐欺ケースが 40% になるように、必要な総件数として n_new を指定します。このために、詐欺ケースの件数を、アンダーサンプリング後に望む詐欺比率で割ってください。
  • データセットをアンダーサンプリングします。
  • アンダーサンプリング後のデータセットのクラスバランスを、table() と prop.table() で確認します。