Mulai sekarangMulai gratis

Menggabungkan ROS & RUS

Anda dapat menggabungkan random over-sampling (ROS) dan random under-sampling (RUS) untuk menyeimbangkan distribusi kelas. Anda akan menyeimbangkan ulang himpunan data sehingga himpunan data baru berisi 10.000 transaksi dengan 30% di antaranya adalah kecurangan.

Ingat, Anda selalu dapat memuat ROSE di konsol dan memasukkan ?ovun.sample untuk memeriksa argumen apa saja yang diterima fungsi tersebut.

Latihan ini merupakan bagian dari kursus

Deteksi Fraud di R

Lihat Kursus

Instruksi latihan

  • Muat paket ROSE.
  • Setel n_new sama dengan 10.000 dan fraud_fraction ke 30%.
  • Gunakan over-sampling dan under-sampling sekaligus.
  • Periksa keseimbangan kelas dari himpunan data yang di-under-sample.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Edit dan Jalankan Kode