1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với R

Connected

Bài tập

Chi phí khi không phát hiện gian lận

Khi không dùng mô hình phát hiện, tất cả giao dịch trong bộ dữ liệu transfers sẽ được xem là hợp lệ. Bạn sẽ xác định ma trận nhầm lẫn tương ứng. Dù gian lận hiếm gặp, tổn thất tài chính có thể rất lớn. Bạn sẽ tính tổng chi phí khi không phát hiện các giao dịch chuyển tiền gian lận.

Gói caret đã được nạp sẵn để bạn dựng confusionMatrix(). Bộ dữ liệu transfers đã có trong môi trường làm việc; bạn có thể khám phá trong Console.

Hướng dẫn

100 XP
  • Dùng rep.int() để tạo một vector tên predictions trong đó tất cả giao dịch đều được dự đoán là hợp lệ (lớp 0). Bạn có thể xem lại các slide để biết cách hàm này được dùng trong video.
  • Dùng hàm confusionMatrix() từ gói caret để tính ma trận nhầm lẫn giữa predictions và cột fraud_flag của transfers.
  • Tính tổng chi phí khi không phát hiện gian lận bằng cách lấy tổng các khoản tiền đã chuyển bị gian lận.