SMOTE
Als je SMOTE gebruikt om de klasse met fraudegevallen te oversamplen, moet je kiezen hoeveel naaste buren worden meegenomen en hoeveel synthetische fraudegevallen je aanmaakt. De volgende oefeningen helpen je om met SMOTE te werken.
De gegevensset creditcard en de libraries smotefamily en ggplot2 zijn al in je werkruimte geladen. Onthoud dat de parameter dup_size antwoord geeft op de vraag hoe vaak SMOTE de bestaande, echte fraudegevallen moet doorlopen.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___