1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Grid search s XGBoostem

Teď, když už víš, jak ladit parametry jednotlivě, posuneme ladění na vyšší úroveň – využijeme možnosti GridSearch a RandomizedSearch ze scikit-learn s interní křížovou validací prostřednictvím funkcí GridSearchCV a RandomizedSearchCV. Pomocí nich najdeš nejlepší model vyčerpávajícím prohledáváním napříč různými kombinacemi hodnot parametrů najednou. Začneme s GridSearchCV!

Pokyny

100 XP
  • Vytvoř mřížku parametrů gbm_param_grid, která bude obsahovat: seznam hodnot "colsample_bytree" (0.3, 0.7), seznam s jednou hodnotou "n_estimators" (50) a seznam dvou hodnot "max_depth" (2, 5).
  • Vytvoř instanci objektu XGBRegressor s názvem gbm.
  • Vytvoř objekt GridSearchCV s názvem grid_mse a předej mu: mřížku parametrů do param_grid, objekt XGBRegressor do estimator, "neg_mean_squared_error" do scoring a 4 do cv. Nastav také verbose=1, aby byl výstup přehlednější.
  • Natrénuj objekt GridSearchCV na datech X a y.
  • Vypiš nejlepší hodnoty parametrů a nejnižší RMSE pomocí atributů .best_params_ a .best_score_ objektu grid_mse.