1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Vizualizace důležitosti příznaků: které příznaky jsou v datasetu nejdůležitější?

Další způsob, jak prozkoumat své XGBoost modely, je podívat se na důležitost jednotlivých sloupcových příznaků původního datasetu v rámci modelu.

Jeden jednoduchý přístup spočívá v tom, že spočítáme, kolikrát byl každý příznak použit jako kritérium rozdělení napříč všemi boosting koly (stromy) v modelu, a výsledek zobrazíme jako sloupcový graf — příznaky jsou seřazeny podle toho, jak často se v modelu vyskytují. XGBoost nabízí funkci plot_importance(), která ti přesně tohle umožňuje, a v tomto cvičení si ji vyzkoušíš!

Pokyny

100 XP
  • Vytvoř DMatrix z X a y stejně jako dříve.
  • Vytvoř slovník parametrů s odpovídající hodnotou "objective" ("reg:squarederror") a "max_depth" nastaveným na 4.
  • Natrénuj model s 10 boosting koly, stejně jako v předchozím cvičení.
  • Pomocí xgb.plot_importance() předej natrénovaný model a vygeneruj graf důležitosti příznaků.