Memvisualisasikan pola dalam data
Langkah pertama sebelum Anda mulai membuat model adalah mengeksplorasi data. Mari mulai dengan menelaah himpunan data Anda dan memvisualisasikan beragam pola antara sampel penipuan dan sampel normal. Kali ini, Anda yang akan membangun visualisasinya!
Himpunan data transfers berisi transfer kredit dan sebagian di antaranya tercatat sebagai penipuan. Kolom fraud_flag menunjukkan apakah transaksi tersebut merupakan penipuan (fraud_flag = 1) atau bukan (fraud_flag = 0). Himpunan data ini dan paket ggplot2 sudah dimuat di ruang kerja Anda.
Latihan ini merupakan bagian dari kursus
Deteksi Fraud di R
Instruksi latihan
- Plot kolom
amountsebagai variabel bebas pada sumbu x, dan kolomorig_balance_before—yakni saldo pada akun pengirim sebelum pembukuan transfer—sebagai variabel terikat pada sumbu y. - Atur warna dan bentuk data berdasarkan nilai pada kolom
fraud_flag.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
geom_point(aes(color = ___, shape = ___)) +
scale_color_manual(values = c('dodgerblue', 'red'))