SMOTE
Lorsque vous utilisez SMOTE pour suréchantillonner la classe des fraudes, vous devez choisir le nombre de plus proches voisins à prendre en compte et combien de cas de fraude synthétiques créer. Les exercices suivants vont vous guider dans l’utilisation de SMOTE.
Le jeu de données creditcard et les bibliothèques smotefamily et ggplot2 sont déjà chargés dans votre environnement. Rappelez-vous que le paramètre dup_size répond à la question : combien de fois SMOTE doit-il itérer sur les cas de fraude réels existants.
Cet exercice fait partie du cours
Détection de fraude en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___