Distribusi kelas yang tidak seimbang
Himpunan data transfers berisi transfer kredit dan sebagian di antaranya tercatat sebagai penipuan. Kolom fraud_flag menunjukkan apakah transaksi tersebut curang (fraud_flag = 1) atau tidak (fraud_flag = 0).
Karena penipuan umumnya sangat jarang terjadi, penting untuk memperhitungkan ketidakseimbangan besar antara jumlah kasus penipuan dan kasus normal. Mari periksa proporsi kasus yang sah dan yang curang serta visualisasikan ketidakseimbangan tersebut dengan diagram pai.
Himpunan data transfers telah dimuat di ruang kerja Anda. Bagian visualisasi sudah disiapkan untuk Anda, karena visualisasi data secara umum berada di luar cakupan kursus ini.
Latihan ini adalah bagian dari kursus
Deteksi Fraud di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the first 6 rows of the dataset
___(transfers)