1. Learn
  2. /
  3. Courses
  4. /
  5. Phát hiện gian lận với Python

Connected

Exercise

Đánh giá các cụm nhỏ nhất

Trong bài tập này, bạn sẽ xem các cụm sinh ra từ DBSCAN và gắn cờ một số cụm là gian lận:

  • trước hết, bạn cần xác định kích thước các cụm và lọc ra các cụm nhỏ nhất
  • sau đó, bạn sẽ lấy các cụm nhỏ nhất và gắn cờ chúng là gian lận
  • cuối cùng, bạn sẽ đối chiếu với nhãn gốc để xem cách làm này có phát hiện gian lận tốt không.

Bạn có sẵn dự đoán của mô hình DBSCAN, nên n_clusters và cả nhãn cụm được lưu trong pred_labels đều sẵn sàng. Hãy thử nhé!

Instructions 1/3

undefined XP
    1
    2
    3
  • Đếm số mẫu trong mỗi cụm bằng cách chạy bincount trên các số cụm dự đoán trong pred_labels và in kết quả.