Ważność cech w gradient boostingu

Podobnie jak w przypadku lasów losowych, z modeli gradient boosting można wyodrębnić ważność cech, aby dowiedzieć się, które z nich najlepiej przewidują wynik. Warto czasem wypróbować różne modele drzewiaste i porównać ważności cech ze wszystkich z nich – pozwala to zniwelować ewentualne osobliwości wynikające z właściwości konkretnego modelu.

Ważności cech są przechowywane jako tablica numpy we właściwości .feature_importances_ modelu gradient boosting. Aby uzyskać ładny wykres, należy wyznaczić posortowane indeksy ważności cech za pomocą np.argsort(). Ponieważ chcemy uszeregować cechy od najważniejszej do najmniej ważnej, użyjemy indeksowania w Pythonie, aby odwrócić posortowane wartości: feat_importances[::-1].

Odwróć zmienną sorted_index, aby przeszła od największych do najmniejszych wartości, używając indeksowania w Pythonie.
Utwórz posortowaną listę etykiet cech jako labels, konwertując feature_names na tablicę numpy i indeksując ją zmienną sorted_index.
Utwórz wykres słupkowy z podziałką osi x, wartościami feature_importances zaindeksowanymi przez sorted_index oraz labels jako etykietami na osi x.

ćwiczenie

Ważność cech w gradient boostingu

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie