1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tinh chỉnh siêu tham số trong Python

Connected

Bài tập

GridSearchCV với Scikit Learn

Mô-đun GridSearchCV của Scikit Learn cung cấp nhiều tính năng hữu ích giúp bạn thực hiện grid search hiệu quả. Giờ bạn sẽ áp dụng kiến thức bằng cách tạo một đối tượng GridSearchCV với các tham số nhất định.

Các tùy chọn cần có:

  • Random Forest Estimator, với tiêu chí chia (split criterion) là 'entropy'
  • Cross validation 5-fold
  • Các siêu tham số max_depth (2, 4, 8, 15) và max_features ('auto' so với 'sqrt')
  • Dùng roc_auc để chấm điểm mô hình
  • Dùng 4 lõi để xử lý song song
  • Đảm bảo refit mô hình tốt nhất và trả về điểm huấn luyện

Bạn có sẵn các tập dữ liệu X_train, X_test, y_train & y_test.

Hướng dẫn

100 XP
  • Tạo một Random Forest estimator như mô tả ở phần ngữ cảnh phía trên.
  • Tạo một lưới tham số (parameter grid) như mô tả ở phần ngữ cảnh phía trên.
  • Tạo một đối tượng GridSearchCV như nêu ở phần ngữ cảnh phía trên, sử dụng hai thành phần bạn đã tạo ở hai bước trước.