1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

Kiểm thử QuantileTransformer

Chuẩn hóa (standardization) dễ gặp cùng vấn đề như z-score. Cả hai đều dùng trung bình và độ lệch chuẩn trong tính toán, nên rất nhạy với giá trị ngoại lai mạnh.

Để khắc phục, bạn nên dùng QuantileTransformer dựa trên các phân vị (quantile). Phân vị của một phân phối không đổi ngay cả khi có ngoại lai lớn.

Bạn nên dùng StandardScaler khi dữ liệu phân phối gần chuẩn (có thể kiểm tra bằng biểu đồ histogram). Với các phân phối khác, QuantileTransformer thường là lựa chọn tốt hơn.

Bạn sẽ thực hành trên bộ dữ liệu females đã được nạp. matplotlib.pyplot đã được nạp với bí danh chuẩn plt.

Hướng dẫn

100 XP
  • Khởi tạo một QuantileTransformer() để biến đổi các đặc trưng về phân phối chuẩn và gán vào qt.
  • Fit và transform mảng đặc trưng X và giữ nguyên tên cột.
  • Vẽ biểu đồ histogram cho cột palmlength.