1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Phân bố lớp mất cân bằng

Bộ dữ liệu transfers chứa các giao dịch chuyển khoản và một số được ghi nhận là gian lận. Cột fraud_flag cho biết giao dịch có gian lận (fraud_flag = 1) hay không (fraud_flag = 0).

Vì gian lận thường rất hiếm, điều quan trọng là phải tính đến mức độ mất cân bằng lớn giữa số trường hợp gian lận và các trường hợp bình thường. Hãy kiểm tra tỷ lệ các trường hợp hợp lệ và gian lận, rồi trực quan hóa sự mất cân bằng này bằng biểu đồ tròn.

Bộ dữ liệu transfers đã được nạp vào không gian làm việc của bạn. Phần trực quan hóa đã được định nghĩa sẵn, vì trực quan hóa dữ liệu nói chung nằm ngoài phạm vi của khóa học này.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • In 6 hàng đầu tiên của transfers để làm quen với dữ liệu.