1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Tinh chỉnh siêu tham số cho bagging

Bạn có thể dễ dàng xây dựng một bộ phân loại bagging với các tham số mặc định, nhưng rất nên tinh chỉnh chúng để đạt hiệu năng tối ưu. Lý tưởng nhất, bạn nên tối ưu bằng K-fold cross-validation.

Trong bài tập này, hãy thử cải thiện hiệu năng mô hình bằng cách thay đổi các tham số của bộ phân loại bagging.

Ở đây, chúng ta cũng truyền tham số solver='liblinear' cho LogisticRegression để giảm thời gian tính toán.

Hướng dẫn

100 XP
  • Xây dựng một bộ phân loại bagging dùng logistic regression làm mô hình cơ sở, với 20 bộ ước lượng cơ sở, 10 số đặc trưng tối đa, 0.65 (65%) số mẫu tối đa (max_samples), và lấy mẫu KHÔNG hoàn lại.
  • Dùng clf_bag để dự đoán nhãn cho tập kiểm tra X_test.