Menggabungkan ROS & RUS
Anda dapat menggabungkan random over-sampling (ROS) dan random under-sampling (RUS) untuk menyeimbangkan distribusi kelas. Anda akan menyeimbangkan ulang himpunan data sehingga himpunan data baru berisi 10.000 transaksi dengan 30% di antaranya adalah kecurangan.
Ingat, Anda selalu dapat memuat ROSE di konsol dan memasukkan ?ovun.sample untuk memeriksa argumen apa saja yang diterima fungsi tersebut.
Latihan ini merupakan bagian dari kursus
Deteksi Fraud di R
Instruksi latihan
- Muat paket
ROSE. - Setel
n_newsama dengan 10.000 danfraud_fractionke 30%. - Gunakan over-sampling dan under-sampling sekaligus.
- Periksa keseimbangan kelas dari himpunan data yang di-under-sample.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))