Coût réel de la détection de fraude
Vous avez entraîné deux modèles : l’un sur l’ensemble d’apprentissage d’origine (model_orig) et l’autre sur l’ensemble rééquilibré (model_smote). Les classes prédites pour les observations de l’ensemble test s’appellent respectivement predicted_class_orig et predicted_class_smote. Plutôt que de comparer des modèles de détection de fraude selon leur exactitude, il est préférable de calculer leur coût de détection.
Voici la définition de la fonction cost_model(). Parcourez-la pour comprendre comment le coût est calculé.
cost_model <- function(predicted.classes, true.classes, amounts, fixedcost) {
library(hmeasure)
predicted.classes <- relabel(predicted.classes)
true.classes <- relabel(true.classes)
cost <- sum(true.classes * (1 - predicted.classes) * amounts + predicted.classes * fixedcost)
return(cost)
}
Cet exercice fait partie du cours
Détection de fraude en R
Instructions
- Utilisez
cost_model()pour calculer le coût réel du déploiement demodel_origsur l’ensemble de test, avecfixedcostégal à 10. - Utilisez
cost_model()pour calculer le coût réel du déploiement demodel_smotesur l’ensemble de test, avecfixedcostégal à 10.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the total cost of deploying the original model
cost_model(___, ___, ___, ___)
# Calculate the total cost of deploying the model using SMOTE
cost_model(___, ___, ___, ___)