1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Khám phá dữ liệu của bạn

Trong các bài tiếp theo, bạn sẽ làm việc với dữ liệu giao dịch thanh toán của ngân hàng. Các giao dịch tài chính được phân loại theo loại chi tiêu và số tiền đã chi. Ngoài ra, bạn còn có một số đặc điểm khách hàng như nhóm tuổi và giới tính. Một số giao dịch được gán nhãn là gian lận; bạn sẽ coi các nhãn này là đã cho và dùng chúng để kiểm định kết quả.

Khi dùng các kỹ thuật học không giám sát để phát hiện gian lận, bạn muốn phân biệt hành vi bình thường và bất thường (có thể là gian lận). Là một nhà phân tích gian lận, để hiểu thế nào là "bình thường", bạn cần nắm rõ dữ liệu và các đặc điểm của nó. Hãy bắt đầu khám phá dữ liệu trong bài đầu tiên này.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Lấy shape của dataframe df để kiểm tra kích thước dữ liệu và hiển thị các dòng đầu để xem có những đặc trưng nào.