1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tinh chỉnh siêu tham số trong Python

Connected

Bài tập

RandomSearchCV trong Scikit Learn

Hãy luyện tập xây dựng một đối tượng RandomizedSearchCV bằng Scikit Learn.

Lưới siêu tham số cần có max_depth (mọi giá trị từ 5 đến 25, bao gồm cả hai đầu) và max_features ('auto' và 'sqrt').

Các tùy chọn cần có cho đối tượng RandomizedSearchCV:

  • Estimator RandomForestClassifier với n_estimators bằng 80.
  • Cross validation 3-fold (cv)
  • Dùng roc_auc để chấm điểm mô hình
  • Dùng 4 lõi để xử lý song song (n_jobs)
  • Đảm bảo bạn refit mô hình tốt nhất và trả về điểm huấn luyện
  • Chỉ lấy mẫu 5 mô hình để hiệu quả (n_iter)

Bộ dữ liệu X_train & y_train đã được nạp sẵn cho bạn.

Hãy nhớ, để trích xuất các siêu tham số đã chọn, chúng nằm trong cv_results_ với một cột cho mỗi siêu tham số. Ví dụ, cột cho siêu tham số criterion sẽ là param_criterion.

Hướng dẫn

100 XP
  • Tạo một lưới siêu tham số như mô tả ở phần ngữ cảnh phía trên.
  • Tạo một đối tượng RandomizedSearchCV như đã nêu trong ngữ cảnh ở trên.
  • Fit đối tượng RandomizedSearchCV vào dữ liệu huấn luyện.
  • Truy cập vào đối tượng cv_results_ để in ra các giá trị được quá trình mô hình hóa chọn cho cả hai siêu tham số (max_depth và max_features).