1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ不正検知

Connected

演習

1つの口座に対する頻度特徴量

頻度特徴量は、過去に特定のイベントがどのくらい起きたかを数えるものです。こうした特徴量を作ると、異常な振る舞いの検知に役立ちます。動画では、カテゴリ変数をもとに頻度特徴量を作る方法を学びました。

ここでは Bob の取引データが与えられています。channel_cd という列は、各取引で Bob が使用した支払いチャネルを表します。rollapply() 関数を使って、channel_cd 列に基づく freq_channel という頻度特徴量を作成しましょう。関数のドキュメントはコンソールで ?rollaply を参照できます。

ワークスペースにはデータセット trans_Bob、パッケージ zoo と dplyr が読み込まれています。

指示

100 XP
  • frequency_fun() という関数を作成します。入力は steps と channel とし、steps の数を数え、直近の channel が過去に何回使われたかを合計します。
  • transfer_id 列に対して rollapply を使い、特徴量 freq_channel を作成します。この特徴量は、ある channel_cd がそれ以前に何回使われたかを数えるものです。
  • channel_cd、freq_channel、fraud_flag の各特徴量を表示します。新しく作成した特徴量を確認しましょう。