1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Trực quan hóa các mẫu trong dữ liệu

Bước đầu tiên trước khi bắt đầu mô hình hóa là khám phá dữ liệu của bạn. Hãy bắt đầu bằng cách xem xét tập dữ liệu và trực quan hóa các mẫu khác nhau giữa các mẫu gian lận và mẫu bình thường. Đặc biệt ở đây, bạn sẽ tự xây dựng biểu đồ!

Tập dữ liệu transfers chứa các giao dịch chuyển khoản và một số được ghi nhận là gian lận. Cột fraud_flag cho biết giao dịch có gian lận (fraud_flag = 1) hay không (fraud_flag = 0). Tập dữ liệu này và gói ggplot2 đã được nạp trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Vẽ cột amount làm biến độc lập trên trục x, và cột orig_balance_before — số dư trên tài khoản của người gửi trước khi hạch toán giao dịch — làm biến phụ thuộc trên trục y.
  • Tô màu và đặt hình dạng dữ liệu dựa trên giá trị trong cột fraud_flag.