1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

Chọn contamination

Mặc dù phần hiện thực mã chỉ cần vài dòng, việc tìm giá trị contamination phù hợp đòi hỏi bạn phải chú ý.

Hãy nhớ rằng tham số contamination chỉ ảnh hưởng đến kết quả của IForst. Khi IForest đã tạo ra các điểm số bất thường thô, contamination được dùng để chọn top n% điểm số bất thường làm ngoại lệ. Ví dụ, contamination 5% sẽ chọn các quan sát có 5% điểm số bất thường cao nhất là ngoại lệ.

Dù chúng ta sẽ thảo luận một số cách tinh chỉnh trong video tiếp theo, bây giờ bạn sẽ thực hành đặt một giá trị tùy ý cho tham số này.

Dữ liệu đã được nạp vào big_mart.

Hướng dẫn

100 XP
  • Khởi tạo một estimator IForest() với contamination 5%.
  • Fit mô hình đó với dữ liệu doanh số Big Mart.