Menggabungkan ROS & RUS
Anda dapat menggabungkan random over-sampling (ROS) dan random under-sampling (RUS) untuk menyeimbangkan distribusi kelas. Anda akan menyeimbangkan ulang himpunan data sehingga himpunan data baru berisi 10.000 transaksi dengan 30% di antaranya adalah kecurangan.
Ingat, Anda selalu dapat memuat ROSE di konsol dan memasukkan ?ovun.sample untuk memeriksa argumen apa saja yang diterima fungsi tersebut.
Latihan ini adalah bagian dari kursus
Deteksi Fraud di R
Petunjuk latihan
- Muat paket
ROSE. - Setel
n_newsama dengan 10.000 danfraud_fractionke 30%. - Gunakan over-sampling dan under-sampling sekaligus.
- Periksa keseimbangan kelas dari himpunan data yang di-under-sample.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load ROSE
___
# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___
# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
___ = ___, ___ = ___, p = ___, seed = 2018)
# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))