1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Chi phí thực sự của phát hiện gian lận

Bạn đã xây dựng hai mô hình trên bộ huấn luyện gốc (model_orig) và bộ huấn luyện đã cân bằng lại (model_smote). Các lớp dự đoán cho các trường hợp trong tập test lần lượt được gọi là predicted_class_orig và predicted_class_smote. Thay vì so sánh các mô hình phát hiện gian lận dựa trên độ chính xác, tốt hơn là bạn nên tính chi phí phát hiện của chúng.

Dưới đây là định nghĩa hàm cost_model(). Hãy xem qua để hiểu cách chi phí được tính.

cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
  library(hmeasure)
  predicted.classes <- relabel(predicted.classes)
  true.classes <- relabel(true.classes)
  cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
  return(cost)
}

Hướng dẫn

100 XP
  • Dùng cost_model() để tính chi phí thực sự khi triển khai model_orig trên tập kiểm tra, với fixedcost bằng 10.
  • Dùng cost_model() để tính chi phí thực sự khi triển khai model_smote trên tập kiểm tra, với fixedcost bằng 10.