1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ不正検知

Connected

演習

統計で通常の振る舞いを定義する

前の演習では、不正が特定の取引カテゴリでより多く発生する一方で、たとえば年齢層のように明確にデータをセグメント化できないことを見てきました。今回は、通常の取引と不正な取引での平均支出額を調べてみましょう。これにより、不正な取引が通常の取引と構造的にどう異なるかの手がかりが得られます。

指示

100 XP
  • 不正と非不正の観測から、それぞれ新しいデータフレームを作成します。df に対して .loc を用い、条件として「fraud が 1 の行」と「fraud が 0 の行」を指定して新しいデータフレームを作成してください。
  • 作成したデータフレームの amount 列をヒストグラムで可視化し、プロットにはそれぞれ fraud と nonfraud のラベルを付けてください。