1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ不正検知

Connected

演習

データのパターンを可視化する

モデリングを始める前の第一歩は、データを探索することです。まずはデータセットを確認し、不正サンプルと通常サンプルの間にどのようなパターンがあるかを可視化してみましょう。今回は特別に、可視化を一から作成していただきます。

データセット transfers にはクレジット振替が含まれており、その一部は不正として記録されています。列 fraud_flag は、その取引が不正(fraud_flag = 1)か否か(fraud_flag = 0)を示します。このデータセットと ggplot2 パッケージはワークスペースに読み込まれています。

指示

100 XP
  • 独立変数として列 amount を x 軸に、被説明変数として列 orig_balance_before(振替計上前の送金元口座の残高)を y 軸にプロットします。
  • データの色と形状は、fraud_flag 列の値に基づいて指定します。