1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Grid search

Bạn có thể thực hiện hyperparameter tuning bằng sklearn thông qua việc cung cấp nhiều tham số đầu vào, mỗi tham số có thể được mã hóa bằng các hàm khác nhau từ numpy. Một phương pháp tuning duyệt cạn tất cả tổ hợp của các siêu tham số được chỉ định qua param_grid là grid search. Trong bài tập này, bạn sẽ dùng grid search để duyệt qua các siêu tham số cho một mô hình random forest classifier mẫu với hàm chấm điểm là AUC của đường cong ROC.

X_train, y_train, X_test, y_test đã có sẵn trong môi trường làm việc của bạn. pandas là pd, numpy là np, và sklearn cũng đã sẵn sàng. Ngoài ra, GridSearchCV() từ sklearn.model_selection cũng có sẵn.

Hướng dẫn

100 XP
  • Tạo danh sách giá trị cho từng siêu tham số trong n_estimators và max_depth.
  • Tạo một random forest classifier.
  • Thiết lập grid search để lặp qua tất cả các tổ hợp siêu tham số.
  • In ra AUC tốt nhất bằng .best_score_, và mô hình tốt nhất dẫn đến điểm số này bằng .best_estimator_.