1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Xem lại contamination

Bạn nhận thấy one-class SVM không có tham số contamination. Nhưng đến giờ bạn hiểu rõ là mình thật sự cần một cách để kiểm soát tỷ lệ mẫu bị gán nhãn là novelty nhằm kiểm soát tỷ lệ dương tính giả. Vì vậy bạn quyết định thử nghiệm đặt ngưỡng trên điểm số. Bộ phát hiện đã được import là onesvm, bạn cũng có sẵn dữ liệu X_train, X_test, y_train, y_test, numpy là np, và confusion_matrix().

Hướng dẫn

100 XP
  • Huấn luyện 1-class SVM và chấm điểm dữ liệu kiểm tra.
  • Tính tỷ lệ outlier quan sát được trong dữ liệu kiểm tra.
  • Dùng np.quantile() để tìm ngưỡng điểm số nhằm đạt đúng tỷ lệ đó.
  • Dùng ngưỡng này để gán nhãn dữ liệu kiểm tra. In ma trận nhầm lẫn.