1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Ladění počtu boosting rounds

Začneme ladění parametrů tím, že zjistíme, jak počet boosting rounds (tedy počet stromů, které model sestaví) ovlivňuje výkon tvého XGBoost modelu na neviděných datech. Použiješ xgb.cv() uvnitř smyčky for a pro každou hodnotu parametru num_boost_round sestavíš jeden model.

Budeme pokračovat s datasetem Ames housing. Příznaky jsou dostupné v poli X, cílový vektor je uložen v y.

Instrukcje

100 XP
  • Z X a y vytvoř DMatrix s názvem housing_dmatrix.
  • Vytvoř slovník parametrů params a zadej příslušný "objective" ("reg:squarederror") a "max_depth" (nastav na 3).
  • Iteruj přes num_rounds ve smyčce for a proveď 3-fold křížovou validaci. V každé iteraci předej aktuální počet boosting rounds (curr_num_rounds) funkci xgb.cv() jako argument num_boost_round.
  • Přidej výslednou hodnotu RMSE posledního boosting round pro každý křížově validovaný XGBoost model do seznamu final_rmse_per_round.
  • num_rounds a final_rmse_per_round byly zkombinovány metodou zip a převedeny do DataFrame, abys snadno viděl/a, jak si model vede v každém boosting round. Klikni na 'Submit Answer' a prohlédni si výsledky!