Aan de slagGa gratis aan de slag

ROS & RUS combineren

Je kunt zowel random over-sampling (ROS) als random under-sampling (RUS) combineren om de klassenverdeling in balans te brengen. Je gaat de gegevensset herverdelen zodat de nieuwe gegevensset 10.000 transacties bevat, waarvan 30% frauduleus is.

Onthoud: je kunt ROSE altijd in de console laden en ?ovun.sample invoeren om te zien welke argumenten de functie verwacht.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in R

Cursus bekijken

Oefeninstructies

  • Laad het ROSE-pakket.
  • Zet n_new op 10.000 en fraud_fraction op 30%.
  • Gebruik zowel over- als under-sampling.
  • Controleer de klassenbalans van de under-samplede gegevensset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Code bewerken en uitvoeren