Werkelijke kosten van fraudedetectie
Je hebt twee modellen gebouwd: één op de originele trainingsset (model_orig) en één op de gebalanceerde trainingsset (model_smote). De voorspelde klassen voor de cases in de test-set heten respectievelijk predicted_class_orig en predicted_class_smote. In plaats van fraudedetectiemodellen te vergelijken op basis van nauwkeurigheid, kun je beter de detectiekosten berekenen.
Hier zie je de definitie van de functie cost_model(). Bekijk deze om te begrijpen hoe de kosten worden berekend.
cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
library(hmeasure)
predicted.classes <- relabel(predicted.classes)
true.classes <- relabel(true.classes)
cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
return(cost)
}
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Oefeninstructies
- Gebruik
cost_model()om de werkelijke kosten te berekenen van het inzetten vanmodel_origop de testset, met eenfixedcostgelijk aan 10. - Gebruik
cost_model()om de werkelijke kosten te berekenen van het inzetten vanmodel_smoteop de testset, met eenfixedcostgelijk aan 10.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)
# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)