Werkelijke kosten van fraudedetectie

Je hebt twee modellen gebouwd: één op de originele trainingsset (model_orig) en één op de gebalanceerde trainingsset (model_smote). De voorspelde klassen voor de cases in de test-set heten respectievelijk predicted_class_orig en predicted_class_smote. In plaats van fraudedetectiemodellen te vergelijken op basis van nauwkeurigheid, kun je beter de detectiekosten berekenen.

Hier zie je de definitie van de functie cost_model(). Bekijk deze om te begrijpen hoe de kosten worden berekend.

cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
  library(hmeasure)
  predicted.classes <- relabel(predicted.classes)
  true.classes <- relabel(true.classes)
  cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
  return(cost)
}

Deze oefening maakt deel uit van de cursus

Fraudedetectie in R

Bekijk cursus

Oefeninstructies

Gebruik cost_model() om de werkelijke kosten te berekenen van het inzetten van model_orig op de testset, met een fixedcost gelijk aan 10.
Gebruik cost_model() om de werkelijke kosten te berekenen van het inzetten van model_smote op de testset, met een fixedcost gelijk aan 10.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)

# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)

Code bewerken en uitvoeren