1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Ladění parametru colsample_bytree

Teď přichází na řadu ladění parametru "colsample_bytree". Pokud jsi někdy pracoval/a se RandomForestClassifier nebo RandomForestRegressor ze scikit-learn, možná si ho pamatuješ pod názvem max_features. V xgboost i sklearn tento parametr (i když se jmenuje jinak) jednoduše určuje, jaká část příznaků se vybírá při každém dělení stromu. V xgboost musí mít colsample_bytree hodnotu typu float v rozsahu od 0 do 1.

Pokyny

100 XP
  • Vytvoř seznam s názvem colsample_bytree_vals, který bude obsahovat hodnoty 0.1, 0.5, 0.8 a 1.
  • Systematicky měň hodnotu "colsample_bytree" a prováděj křížovou validaci, přesně jako v případě max_depth a eta.