1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Wizualizacja ważności cech: które cechy są najważniejsze w moim zbiorze danych

Innym sposobem analizy modeli XGBoost jest sprawdzenie, jak duże znaczenie ma każda kolumna cech z oryginalnego zbioru danych w kontekście modelu.

Jedna z prostych metod polega na zliczeniu, ile razy każda cecha posłużyła jako punkt podziału we wszystkich rundach boostingu (drzewach) w modelu, a następnie przedstawieniu wyników jako wykres słupkowy – cechy są uszeregowane według częstotliwości występowania. XGBoost udostępnia funkcję plot_importance(), która robi dokładnie to. W tym ćwiczeniu sam ją wypróbujesz!

Instrukcje

100 XP
  • Utwórz DMatrix z X i y tak jak wcześniej.
  • Utwórz słownik parametrów z odpowiednim "objective" ("reg:squarederror") oraz "max_depth" równym 4.
  • Wytrenuj model przez 10 rund boostingu, dokładnie tak samo jak w poprzednim ćwiczeniu.
  • Użyj funkcji xgb.plot_importance() i przekaż do niej wytrenowany model, aby wygenerować wykres ważności cech.