1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Měření přesnosti

Teď si procvičíš práci s učícím API XGBoostu a jeho vestavěnými možnostmi křížové validace. Jak Sergey zmínil v předchozím videu, XGBoost dosahuje svého vynikajícího výkonu a efektivity díky vlastní optimalizované datové struktuře pro datasety zvané DMatrix.

V předchozím cvičení byly vstupní datasety převedeny na DMatrix automaticky za běhu. Pokud ale používáš objekt cv z knihovny xgboost, musíš data do formátu DMatrix převést explicitně předem. Přesně to teď uděláš, než spustíš křížovou validaci na datech churn_data.

Pokyny

100 XP
  • Vytvoř DMatrix s názvem churn_dmatrix z dat churn_data pomocí xgb.DMatrix(). Příznaky jsou dostupné v X, štítky v y.
  • Proveď 3-násobnou křížovou validaci voláním xgb.cv(). dtrain je tvůj churn_dmatrix, params je slovník parametrů, nfold je počet foldů křížové validace (3), num_boost_round je počet stromů, které chceme sestavit (5), a metrics je metrika, kterou chceš vypočítat (použij "error", kterou následně převedeme na přesnost).