1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶ不正検知

Connected

Bài tập

データを可視化する

前の演習から、詐欺と非詐欺の観測比率が非常に低いことがわかりました。次の動画で説明するように、データを再サンプリング(re-sampling)するなどの対処が可能です。

この演習では、まずデータを確認し、詐欺と非詐欺の比率を可視化します。詐欺検知の分析では、データを変更する前に、まず中身を確認するのが良い出発点です。

また、同僚に説明する際も、図を見せるとデータの不均衡がどれほど大きいかが明確になります。 データセット df 上で、詐欺と非詐欺データ点の比率を可視化するプロットを作成しましょう。

prep_data() 関数はワークスペースに読み込まれており、matplotlib.pyplot は plt としてインポート済みです。

Hướng dẫn

100 XP
  • 与えられた特徴量集合 X とラベル y を散布図で見やすく描画する plot_data(X, y) 関数を定義してください。こちらはすでに用意されています。

  • データセット df に対して prep_data() 関数を使い、特徴量集合 X とラベル y を作成してください。

  • 作成した X と y を使って plot_data() 関数を実行し、結果を可視化してください。