1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Důležitost příznaků v gradient boosting modelu

Stejně jako u random forests můžeme z gradient boosting modelů extrahovat důležitost příznaků a zjistit, které z nich jsou nejlepšími prediktory. Občas se vyplatí vyzkoušet různé modely založené na stromech a porovnat důležitost příznaků ve všech z nich – tím lze vyrovnat případné zvláštnosti, které by mohly vzniknout u jednoho konkrétního modelu.

Důležitost příznaků je uložena jako pole numpy ve vlastnosti .feature_importances_ gradient boosting modelu. Pro vytvoření přehledného grafu budeme potřebovat seřazené indexy důležitosti příznaků pomocí np.argsort(). Protože chceme příznaky seřazené od největšího po nejmenší, použijeme indexování Pythonu k obrácení seřazených hodnot: feat_importances[::-1].

Pokyny

100 XP
  • Obrať proměnnou sorted_index tak, aby byla seřazena od největší hodnoty po nejmenší – použij indexování Pythonu.
  • Vytvoř seřazený seznam popisků příznaků jako labels: převeď feature_names na numpy pole a indexuj ho pomocí sorted_index.
  • Vytvoř sloupcový graf s hodnotami na ose x, hodnotami feature_importances indexovanými proměnnou sorted_index a popisky labels jako popisy na ose x.