1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Một mô hình bagging phức tạp hơn

Sau khi đã khám phá dữ liệu bán dẫn, giờ hãy xây dựng một bộ phân loại bagging để dự đoán nhãn 'Pass/Fail' từ các đặc trưng đầu vào.

Bộ dữ liệu đã được tiền xử lý có sẵn trong workspace của bạn dưới tên uci_secom, và các tập huấn luyện/kiểm tra đã được tạo sẵn.

Vì biến mục tiêu có mất cân bằng lớp cao, hãy dùng logistic regression "balanced" làm bộ phân loại cơ sở ở đây.

Chúng ta cũng sẽ rút ngắn thời gian tính toán cho LogisticRegression bằng tham số solver='liblinear', là bộ tối ưu nhanh hơn so với mặc định.

Hướng dẫn

100 XP
  • Khởi tạo một logistic regression để dùng làm bộ phân loại cơ sở với các tham số: class_weight='balanced', solver='liblinear', và random_state=42.
  • Xây dựng một bagging classifier sử dụng logistic regression làm base estimator, chỉ định số lượng đặc trưng tối đa là 10, và bật tính điểm out-of-bag.
  • In điểm out-of-bag để so sánh với độ chính xác.