Memvisualisasikan pola dalam data
Langkah pertama sebelum Anda mulai membuat model adalah mengeksplorasi data. Mari mulai dengan menelaah himpunan data Anda dan memvisualisasikan beragam pola antara sampel penipuan dan sampel normal. Kali ini, Anda yang akan membangun visualisasinya!
Himpunan data transfers berisi transfer kredit dan sebagian di antaranya tercatat sebagai penipuan. Kolom fraud_flag menunjukkan apakah transaksi tersebut merupakan penipuan (fraud_flag = 1) atau bukan (fraud_flag = 0). Himpunan data ini dan paket ggplot2 sudah dimuat di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Deteksi Fraud di R
Petunjuk latihan
- Plot kolom
amountsebagai variabel bebas pada sumbu x, dan kolomorig_balance_before—yakni saldo pada akun pengirim sebelum pembukuan transfer—sebagai variabel terikat pada sumbu y. - Atur warna dan bentuk data berdasarkan nilai pada kolom
fraud_flag.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
geom_point(aes(color = ___, shape = ___)) +
scale_color_manual(values = c('dodgerblue', 'red'))