1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Huấn luyện các mô hình XGBoost

Bất kỳ phương pháp Machine Learning nào cũng có thể bị overfit. Bạn sẽ thấy điều đó qua ví dụ với XGBoost này. Một lần nữa, bạn đang làm việc với bài toán Store Item Demand Forecasting Challenge. DataFrame train đã có sẵn trong không gian làm việc của bạn.

Trước hết, hãy huấn luyện nhiều mô hình XGBoost với các bộ siêu tham số khác nhau bằng API học của XGBoost. Siêu tham số duy nhất bạn sẽ thay đổi là:

  • max_depth - độ sâu tối đa của một cây. Tăng giá trị này sẽ làm mô hình phức tạp hơn và dễ bị overfit hơn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Đặt độ sâu tối đa là 2. Sau đó nhấn "Gửi câu trả lời" để huấn luyện mô hình đầu tiên.
  • 2
    • Bây giờ, đặt độ sâu tối đa là 8. Sau đó nhấn "Gửi câu trả lời" để huấn luyện mô hình thứ hai.
  • 3
    • Cuối cùng, đặt độ sâu tối đa là 15. Sau đó nhấn "Gửi câu trả lời" để huấn luyện mô hình thứ ba.