1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Dostrajanie liczby rund boostingu

Zacznijmy dostrajanie parametrów od sprawdzenia, jak liczba rund boostingu (czyli liczba budowanych drzew) wpływa na wydajność modelu XGBoost na danych spoza zbioru treningowego. Użyjesz xgb.cv() wewnątrz pętli for i zbudujesz jeden model dla każdej wartości parametru num_boost_round.

W tym ćwiczeniu kontynuujesz pracę ze zbiorem danych dotyczącym cen nieruchomości w Ames. Cechy są dostępne w tablicy X, a wektor docelowy – w zmiennej y.

Instrukcje

100 XP
  • Utwórz obiekt DMatrix o nazwie housing_dmatrix na podstawie X i y.
  • Utwórz słownik parametrów o nazwie params, przekazując odpowiednią wartość "objective" ("reg:squarederror") oraz "max_depth" (ustaw na 3).
  • Iteruj po num_rounds wewnątrz pętli for i przeprowadź 3-krotną walidację krzyżową. W każdej iteracji przekaż bieżącą liczbę rund boostingu (curr_num_rounds) do xgb.cv() jako argument num_boost_round.
  • Dodaj wartość RMSE z ostatniej rundy boostingu dla każdego modelu XGBoost walidowanego krzyżowo do listy final_rmse_per_round.
  • Wartości num_rounds i final_rmse_per_round zostały połączone i przekonwertowane do postaci DataFrame, dzięki czemu możesz łatwo zobaczyć, jak model radzi sobie przy każdej liczbie rund boostingu. Kliknij „Prześlij odpowiedź", aby zobaczyć wyniki!