1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Gradient Boosting Cực Mạnh với XGBoost

Connected

Bài tập

Tinh chỉnh số vòng boosting

Bắt đầu tinh chỉnh tham số bằng cách xem số vòng boosting (số cây được xây dựng) ảnh hưởng thế nào đến hiệu năng ngoài mẫu của mô hình XGBoost. Bạn sẽ dùng xgb.cv() trong một vòng lặp for và xây một mô hình cho mỗi giá trị của tham số num_boost_round.

Ở đây, bạn sẽ tiếp tục làm việc với bộ dữ liệu nhà ở Ames. Các đặc trưng có trong mảng X, và vector mục tiêu nằm trong y.

Hướng dẫn

100 XP
  • Tạo một DMatrix tên là housing_dmatrix từ X và y.
  • Tạo một từ điển tham số tên là params, truyền vào "objective" phù hợp ("reg:squarederror") và "max_depth" (đặt là 3).
  • Lặp qua num_rounds trong một vòng lặp for và thực hiện cross-validation 3-fold. Ở mỗi vòng lặp, truyền số vòng boosting hiện tại (curr_num_rounds) vào xgb.cv() dưới dạng đối số cho num_boost_round.
  • Thêm (append) giá trị RMSE ở vòng boosting cuối cùng cho mỗi mô hình XGBoost đã cross-validate vào danh sách final_rmse_per_round.
  • num_rounds và final_rmse_per_round đã được zip và chuyển thành một DataFrame để bạn dễ dàng xem mô hình hoạt động thế nào ở mỗi vòng boosting. Nhấn "Gửi câu trả lời" để xem kết quả!