CommencerCommencer gratuitement

Coût de la non-détection de fraude

Lorsqu’aucun modèle de détection n’est utilisé, toutes les transactions du jeu de données transfers sont considérées comme légitimes. Vous allez déterminer la matrice de confusion correspondante. Même si la fraude est rare, les pertes financières peuvent être considérables. Vous calculerez le coût total de la non-détection des virements frauduleux.

Le package caret est déjà chargé afin que vous puissiez construire la fonction confusionMatrix(). Le jeu de données transfers est chargé dans votre espace de travail ; n’hésitez pas à l’explorer dans la Console.

Cet exercice fait partie du cours

Détection de fraude en R

Afficher le cours

Instructions

  • Utilisez rep.int() pour créer un vecteur appelé predictions dans lequel tous les virements sont prédits comme légitimes (classe 0). N’hésitez pas à consulter les diapos pour voir comment cette fonction a été utilisée dans la vidéo.
  • Utilisez la fonction confusionMatrix() du package caret pour calculer la matrice de confusion de predictions et de la colonne fraud_flag de transfers.
  • Calculez le coût total de la non-détection de la fraude comme la somme des montants transférés frauduleux.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create vector predictions containing 0 for every transfer
predictions <- factor(___(___, times = ___(___)), levels = c(0, 1))

# Compute confusion matrix
confusionMatrix(data = ___, reference = ___)

# Compute cost of not detecting fraud
cost <- sum(___[___ == ___])
print(cost)
Modifier et exécuter le code