1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Ważność cech w gradient boostingu

Podobnie jak w przypadku lasów losowych, z modeli gradient boosting można wyodrębnić ważność cech, aby dowiedzieć się, które z nich najlepiej przewidują wynik. Warto czasem wypróbować różne modele drzewiaste i porównać ważności cech ze wszystkich z nich – pozwala to zniwelować ewentualne osobliwości wynikające z właściwości konkretnego modelu.

Ważności cech są przechowywane jako tablica numpy we właściwości .feature_importances_ modelu gradient boosting. Aby uzyskać ładny wykres, należy wyznaczić posortowane indeksy ważności cech za pomocą np.argsort(). Ponieważ chcemy uszeregować cechy od najważniejszej do najmniej ważnej, użyjemy indeksowania w Pythonie, aby odwrócić posortowane wartości: feat_importances[::-1].

Instrukcje

100 XP
  • Odwróć zmienną sorted_index, aby przeszła od największych do najmniejszych wartości, używając indeksowania w Pythonie.
  • Utwórz posortowaną listę etykiet cech jako labels, konwertując feature_names na tablicę numpy i indeksując ją zmienną sorted_index.
  • Utwórz wykres słupkowy z podziałką osi x, wartościami feature_importances zaindeksowanymi przez sorted_index oraz labels jako etykietami na osi x.