1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

LOF với xác suất ngoại lệ

Như mọi khi, hãy kiểm tra lại mức độ nhiễm bẩn (contamination) đã chọn có đáng tin cậy không bằng cách lọc các điểm ngoại lệ theo một ngưỡng xác suất. Cú pháp giống hệt với KNN.

Bộ ước lượng LOF đã được import, và tập dữ liệu females_transformed cũng đã sẵn sàng.

Hướng dẫn

100 XP
  • Khởi tạo LOF() với 20 láng giềng.
  • Tính xác suất ngoại lệ và gán vào probs.
  • Tạo một mask boolean tên is_outlier trả về giá trị true khi xác suất ngoại lệ trên 50%.
  • Dùng is_outlier để lọc các ngoại lệ từ females_transformed.