MulaiMulai sekarang secara gratis

Menggabungkan ROS & RUS

Anda dapat menggabungkan random over-sampling (ROS) dan random under-sampling (RUS) untuk menyeimbangkan distribusi kelas. Anda akan menyeimbangkan ulang himpunan data sehingga himpunan data baru berisi 10.000 transaksi dengan 30% di antaranya adalah kecurangan.

Ingat, Anda selalu dapat memuat ROSE di konsol dan memasukkan ?ovun.sample untuk memeriksa argumen apa saja yang diterima fungsi tersebut.

Latihan ini adalah bagian dari kursus

Deteksi Fraud di R

Lihat Kursus

Petunjuk latihan

  • Muat paket ROSE.
  • Setel n_new sama dengan 10.000 dan fraud_fraction ke 30%.
  • Gunakan over-sampling dan under-sampling sekaligus.
  • Periksa keseimbangan kelas dari himpunan data yang di-under-sample.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load ROSE
___

# Specify the desired number of cases in the balanced dataset and the fraction of fraud cases
n_new <- ___
fraud_fraction <- ___

# Combine ROS & RUS!
sampling_result <- ___(___ = ___, ___ = ___,
                           ___ = ___, ___ = ___,  p = ___, seed = 2018)

# Verify the Class-balance of the re-balanced dataset
sampled_credit <- ___
prop.table(___(___))
Edit dan Jalankan Kode