1. Learn
  2. /
  3. Courses
  4. /
  5. Phát hiện bất thường với Python

Connected

Exercise

Tìm ngoại lệ bằng z-score

Phân phối chuẩn xuất hiện khắp nơi trong tự nhiên và là phân phối phổ biến nhất. Vì vậy, phương pháp z-score có thể là một trong những cách nhanh nhất để phát hiện ngoại lệ.

Nhắc lại quy tắc thực hành từ video: nếu một mẫu cách trung bình hơn ba độ lệch chuẩn, bạn có thể xem đó là một giá trị cực đoan.

Tuy nhiên, cũng cần thận trọng khi dùng z-score. Phương pháp này chỉ phù hợp khi bạn tin tưởng dữ liệu xuất phát từ phân phối chuẩn. Nếu không, kết quả có thể gây hiểu lầm.

Phân phối prices đã được nạp sẵn cho bạn.

Instructions

100 XP
  • Import hàm zscore từ module scipy liên quan.
  • Tính z-score của prices và lưu vào scores.
  • Tạo một mặt nạ boolean tên is_over_3 để kiểm tra xem giá trị tuyệt đối của scores có lớn hơn 3 không.
  • Dùng mặt nạ để lọc prices nhằm lấy các ngoại lệ.