SMOTE
Saat menggunakan SMOTE untuk melakukan over-sampling pada kelas kasus kecurangan, Anda perlu menentukan jumlah tetangga terdekat yang diperhitungkan dan berapa banyak kasus kecurangan sintetis yang akan dibuat. Latihan berikut akan memandu Anda menggunakan SMOTE.
Himpunan data creditcard serta pustaka smotefamily dan ggplot2 sudah dimuat di ruang kerja Anda. Ingat bahwa parameter dup_size menjawab pertanyaan berapa kali SMOTE harus mengulang melalui kasus kecurangan nyata yang sudah ada.
Latihan ini adalah bagian dari kursus
Deteksi Fraud di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the number of fraud and legitimate cases, and the desired percentage of legitimate cases
n0 <- ___; n1 <- ___; r0 <- ___