1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Phương pháp Elbow

Ở bài trước, bạn đã triển khai MiniBatch K-means với 8 cụm mà chưa thực sự kiểm tra số lượng cụm phù hợp. Với cách tiếp cận phát hiện gian lận đầu tiên, việc xác định đúng số lượng cụm là rất quan trọng, đặc biệt khi bạn muốn dùng các điểm ngoại lai của những cụm đó làm dự đoán gian lận. Để quyết định số lượng cụm sẽ dùng, hãy áp dụng phương pháp Elbow và xem theo phương pháp này thì số cụm tối ưu nên là bao nhiêu.

X_scaled vẫn sẵn sàng để bạn sử dụng và MiniBatchKMeans đã được import từ sklearn.

Hướng dẫn

100 XP
  • Đặt phạm vi số cụm từ 1 đến 5.
  • Chạy MiniBatch K-means cho tất cả các số cụm trong phạm vi bằng list comprehension.
  • Fit từng mô hình trên dữ liệu đã chuẩn hóa và lấy điểm số (scores) từ dữ liệu đã chuẩn hóa.
  • Vẽ số cụm và điểm số tương ứng của chúng; quá trình này sẽ mất vài giây.