Die wahren Kosten der Betrugserkennung
Du hast zwei Modelle trainiert: eines auf dem ursprünglichen Trainingssatz (model_orig) und eines auf dem neu ausbalancierten Trainingssatz (model_smote). Die vorhergesagten Klassen für die Fälle im test-Satz heißen entsprechend predicted_class_orig und predicted_class_smote. Anstatt Betrugserkennungsmodelle anhand ihrer Accuracy zu vergleichen, ist es besser, die Kosten der Erkennung zu berechnen.
Hier ist die Definition der Funktion cost_model(). Sieh sie dir an, um zu verstehen, wie die Kosten berechnet werden.
cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
library(hmeasure)
predicted.classes <- relabel(predicted.classes)
true.classes <- relabel(true.classes)
cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
return(cost)
}
Diese Übung ist Teil des Kurses
Fraud Detection in R
Anleitung zur Übung
- Verwende
cost_model(), um die tatsächlichen Kosten für den Einsatz vonmodel_origauf dem Testsatz mit einemfixedcostvon 10 zu berechnen. - Verwende
cost_model(), um die tatsächlichen Kosten für den Einsatz vonmodel_smoteauf dem Testsatz mit einemfixedcostvon 10 zu berechnen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)
# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)