CommencerCommencer gratuitement

Répartition déséquilibrée des classes

Le jeu de données transfers contient des virements, dont certains ont été identifiés comme frauduleux. La colonne fraud_flag indique si la transaction est frauduleuse (fraud_flag = 1) ou non (fraud_flag = 0).

Comme la fraude est généralement très rare, il est essentiel de tenir compte du fort déséquilibre entre le nombre de cas frauduleux et les cas réguliers. Vérifions la proportion de cas légitimes et frauduleux et visualisons ce déséquilibre avec un diagramme circulaire.

Le jeu de données transfers est chargé dans votre espace de travail. La partie visualisation a été préparée pour vous, car la visualisation de données en général n’entre pas dans le périmètre de ce cours.

Cet exercice fait partie du cours

Détection de fraude en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the first 6 rows of the dataset
___(transfers)
Modifier et exécuter le code