1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Grid search

Hãy nhớ rằng bạn đã tạo một mô hình Gradient Boosting nền tảng ở bài trước. Mục tiêu của bạn bây giờ là tìm giá trị siêu tham số max_depth tốt nhất cho mô hình Gradient Boosting này. Siêu tham số này giới hạn số lượng nút trong mỗi cây riêng lẻ. Bạn sẽ dùng K-fold cross-validation để đo lường hiệu năng nội bộ của mô hình với từng giá trị siêu tham số.

Bạn được cung cấp hàm get_cv_score(), hàm này nhận tập dữ liệu huấn luyện và một từ điển các tham số mô hình làm đối số và trả về điểm RMSE xác thực tổng thể qua cross-validation 3-fold.

Hướng dẫn

100 XP
  • Xác định lưới các giá trị khả dĩ cho max_depth gồm 3, 6, 9, 12 và 15.
  • Truyền từng ứng viên siêu tham số trong lưới vào từ điển params của mô hình.