1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện bất thường với Python

Connected

Bài tập

Chọn n_estimators

n_estimators là tham số ảnh hưởng nhiều nhất đến hiệu năng mô hình. Xây dựng IForest với đủ số cây sẽ giúp thuật toán có đủ khả năng khái quát để tách các điểm ngoại lai khỏi dữ liệu bình thường. Số lượng cây tối ưu phụ thuộc vào kích thước dữ liệu; nếu quá cao hoặc quá thấp đều dẫn đến dự đoán thiếu chính xác.

Hãy thực hành thiết lập n_estimators trên tập dữ liệu big_mart, đã được nạp sẵn cùng với IForest từ pyod.

Hướng dẫn

100 XP
  • Tạo một bộ ước lượng IForest() với 300 iTree.
  • Fit mô hình với big_mart.