1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Gradient Boosting Cực Mạnh với XGBoost

Connected

Bài tập

Tinh chỉnh colsample_bytree

Giờ là lúc tinh chỉnh "colsample_bytree". Bạn sẽ thấy quen nếu từng dùng RandomForestClassifier hoặc RandomForestRegressor của scikit-learn, nơi tham số này được gọi là max_features. Trong cả xgboost và sklearn, tham số này (dù tên khác nhau) đơn giản là chỉ định tỷ lệ đặc trưng được chọn tại mỗi lần chia trong một cây. Trong xgboost, colsample_bytree phải là một số thực trong khoảng từ 0 đến 1.

Hướng dẫn

100 XP
  • Tạo danh sách tên colsample_bytree_vals để lưu các giá trị 0.1, 0.5, 0.8, và 1.
  • Thay đổi có hệ thống "colsample_bytree" và thực hiện cross-validation, giống hệt như bạn đã làm với max_depth và eta trước đó.