1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

Sử dụng xác suất outlier

Một cách khác để tách outlier ngoài contamination là dùng xác suất outlier. Điểm hay của phương pháp này là bạn có thể chọn ngưỡng xác suất tùy ý, nghĩa là bạn có thể tự đặt mức độ tin cậy mong muốn cho dự đoán.

IForest và big_mart đã được nạp sẵn.

Hướng dẫn

100 XP
  • Tính xác suất cho cả inlier và outlier.
  • Trích xuất xác suất của outlier vào outlier_probs.
  • Lọc các outlier vào outliers bằng cách dùng ngưỡng 70% trên outlier_probs.