ROS & RUS combineren
Je kunt zowel random over-sampling (ROS) als random under-sampling (RUS) combineren om de klassenverdeling in balans te brengen. Je gaat de gegevensset herverdelen zodat de nieuwe gegevensset 10.000 transacties bevat, waarvan 30% frauduleus is.
Onthoud: je kunt ROSE altijd in de console laden en ?ovun.sample invoeren om te zien welke argumenten de functie verwacht.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Oefeninstructies
- Laad het
ROSE-pakket. - Zet
n_newop 10.000 enfraud_fractionop 30%. - Gebruik zowel over- als under-sampling.
- Controleer de klassenbalans van de under-samplede gegevensset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))