Die wahren Kosten der Betrugserkennung

Du hast zwei Modelle trainiert: eines auf dem ursprünglichen Trainingssatz (model_orig) und eines auf dem neu ausbalancierten Trainingssatz (model_smote). Die vorhergesagten Klassen für die Fälle im test-Satz heißen entsprechend predicted_class_orig und predicted_class_smote. Anstatt Betrugserkennungsmodelle anhand ihrer Accuracy zu vergleichen, ist es besser, die Kosten der Erkennung zu berechnen.

Hier ist die Definition der Funktion cost_model(). Sieh sie dir an, um zu verstehen, wie die Kosten berechnet werden.

cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
  library(hmeasure)
  predicted.classes <- relabel(predicted.classes)
  true.classes <- relabel(true.classes)
  cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
  return(cost)
}

Diese Übung ist Teil des Kurses

<Kurs>Fraud Detection in R</Kurs>

Kurs ansehen

Übungsanweisungen

Verwende cost_model(), um die tatsächlichen Kosten für den Einsatz von model_orig auf dem Testsatz mit einem fixedcost von 10 zu berechnen.
Verwende cost_model(), um die tatsächlichen Kosten für den Einsatz von model_smote auf dem Testsatz mit einem fixedcost von 10 zu berechnen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)

# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)

Code bearbeiten und ausführen