Coût réel de la détection de fraude

Vous avez entraîné deux modèles : l’un sur l’ensemble d’apprentissage d’origine (model_orig) et l’autre sur l’ensemble rééquilibré (model_smote). Les classes prédites pour les observations de l’ensemble test s’appellent respectivement predicted_class_orig et predicted_class_smote. Plutôt que de comparer des modèles de détection de fraude selon leur exactitude, il est préférable de calculer leur coût de détection.

Voici la définition de la fonction cost_model(). Parcourez-la pour comprendre comment le coût est calculé.

cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
  library(hmeasure)
  predicted.classes <- relabel(predicted.classes)
  true.classes <- relabel(true.classes)
  cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
  return(cost)
}

Cet exercice fait partie du cours

<cours>Détection de fraude en R</cours>

Voir le cours

Instructions de l’exercice

Utilisez cost_model() pour calculer le coût réel du déploiement de model_orig sur l’ensemble de test, avec fixedcost égal à 10.
Utilisez cost_model() pour calculer le coût réel du déploiement de model_smote sur l’ensemble de test, avec fixedcost égal à 10.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)

# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)

Modifier et exécuter le code