1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Strojenie colsample_bytree

Czas teraz nastroić "colsample_bytree". Jeśli pracowałeś kiedyś z RandomForestClassifier lub RandomForestRegressor z biblioteki scikit-learn, ten parametr jest ci już znany – tam nazywał się max_features. Zarówno w xgboost, jak i w sklearn, parametr ten – choć inaczej nazwany – określa ułamek cech losowanych przy każdym podziale w danym drzewie. W xgboost wartość colsample_bytree musi być liczbą zmiennoprzecinkową z przedziału od 0 do 1.

Instrukcje

100 XP
  • Utwórz listę o nazwie colsample_bytree_vals, która będzie przechowywać wartości 0.1, 0.5, 0.8 i 1.
  • Systematycznie zmieniaj wartość "colsample_bytree" i przeprowadzaj kroswalidację – dokładnie tak samo, jak wcześniej robiłeś to dla max_depth i eta.