1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶ不正検知

Connected

연습 문제

適合率-再現率曲線(Precision-Recall Curve)をプロットする

モデルにおける適合率と再現率のトレードオフを調べるには、適合率-再現率曲線(Precision-Recall curve)をプロットする方法もあります。この曲線では、適合率と再現率は逆相関します。適合率が上がると再現率は下がり、その逆も起こります。どちらかに偏りすぎると、誤検知(偽陽性)が多くなったり、実際の不正検知(真陽性)が不足したりするため、両者のバランスを取ることが重要です。性能を比較し、このバランスを探るうえで、適合率-再現率曲線は有用です。

Random Forest Classifier は model、その予測は predicted として利用できます。sklearn パッケージから平均適合率スコアと PR 曲線を簡単に取得できます。関数 plot_pr_curve() が結果をプロットしてくれます。試してみましょう。

지침 1/3

undefined XP
    1
    2
    3
  • 実際のラベル y_test と予測ラベル predicted を引数にして関数を実行し、平均適合率を計算します。