不正検知の真のコスト

元の訓練データで学習したモデル（model_orig）と、再サンプリング後の訓練データで学習したモデル（model_smote）の2つを用意しました。test セットに対するそれぞれの予測クラスは、predicted_class_orig と predicted_class_smote です。不正検知モデルを精度だけで比較するのではなく、検知にかかるコストで評価する方が適切です。

以下は cost_model() 関数の定義です。どのようにコストを計算しているか確認しましょう。

cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
  library(hmeasure)
  predicted.classes <- relabel(predicted.classes)
  true.classes <- relabel(true.classes)
  cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
  return(cost)
}

cost_model() を使って、fixedcost を 10 として model_orig をテストセットに適用したときの真のコストを計算してください。
cost_model() を使って、fixedcost を 10 として model_smote をテストセットに適用したときの真のコストを計算してください。

演習

不正検知の真のコスト

指示

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習

指示

演習