1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Dùng thống kê để xác định hành vi bình thường

Trong các bài trước, bạn đã thấy gian lận phổ biến hơn ở một số loại giao dịch nhất định, nhưng không có cách rõ ràng để phân đoạn dữ liệu, chẳng hạn theo nhóm tuổi. Lần này, hãy khảo sát giá trị trung bình đã chi trong các giao dịch bình thường so với giao dịch gian lận. Điều này giúp bạn hình dung các giao dịch gian lận khác biệt về mặt cấu trúc so với các giao dịch bình thường như thế nào.

Hướng dẫn

100 XP
  • Tạo hai dataframe mới từ các quan sát gian lận và không gian lận. Lấy dữ liệu trong df bằng .loc và đặt điều kiện "nơi fraud bằng 1" và "nơi fraud bằng 0" để tạo các dataframe mới.
  • Vẽ cột amount của các dataframe vừa tạo bằng hàm vẽ biểu đồ histogram và lần lượt gán nhãn fraud và nonfraud cho các biểu đồ.