1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Dùng phân loại ML để phát hiện gian lận

Trong bài tập này, bạn sẽ xem điều gì xảy ra khi dùng một mô hình machine learning đơn giản trên dữ liệu thẻ tín dụng của chúng ta.

Bạn nghĩ mình có thể vượt qua các kết quả trước đó không? Nhớ rằng, bạn đã dự đoán đúng 22 trên 50 trường hợp gian lận, và có 16 dương tính giả.

Với điều đó, hãy triển khai mô hình Logistic Regression. Nếu bạn đã học lớp về supervised learning trong Python, bạn sẽ thấy quen thuộc với mô hình này. Nếu chưa, bạn có thể ôn lại một chút ở đây. Nhưng đừng lo, bạn sẽ được hướng dẫn qua cấu trúc của mô hình machine learning.

Các biến X và y đã có sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • Chia X và y thành dữ liệu huấn luyện và kiểm tra, giữ 30% dữ liệu cho kiểm tra.
  • Khớp (fit) mô hình vào dữ liệu huấn luyện của bạn.
  • Lấy nhãn dự đoán của mô hình bằng cách chạy model.predict trên X_test.
  • Tạo báo cáo phân loại so sánh y_test với predicted, và dùng ma trận nhầm lẫn đã cho để kiểm tra kết quả.