Coût de la non-détection de fraude
Lorsqu’aucun modèle de détection n’est utilisé, toutes les transactions du jeu de données transfers sont considérées comme légitimes. Vous allez déterminer la matrice de confusion correspondante. Même si la fraude est rare, les pertes financières peuvent être considérables. Vous calculerez le coût total de la non-détection des virements frauduleux.
Le package caret est déjà chargé afin que vous puissiez construire la fonction confusionMatrix(). Le jeu de données transfers est chargé dans votre espace de travail ; n’hésitez pas à l’explorer dans la Console.
Cet exercice fait partie du cours
Détection de fraude en R
Instructions
- Utilisez
rep.int()pour créer un vecteur appelépredictionsdans lequel tous les virements sont prédits comme légitimes (classe 0). N’hésitez pas à consulter les diapos pour voir comment cette fonction a été utilisée dans la vidéo. - Utilisez la fonction
confusionMatrix()du packagecaretpour calculer la matrice de confusion depredictionset de la colonnefraud_flagdetransfers. - Calculez le coût total de la non-détection de la fraude comme la somme des montants transférés frauduleux.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create vector predictions containing 0 for every transfer
predictions <- factor(___(___, times = ___(___)), levels = c(0, 1))
# Compute confusion matrix
confusionMatrix(data = ___, reference = ___)
# Compute cost of not detecting fraud
cost <- sum(___[___ == ___])
print(cost)