1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Pomiar dokładności

Teraz przećwiczysz korzystanie z API uczenia XGBoost wraz z wbudowanymi możliwościami walidacji krzyżowej. Jak omawiał Siergiej w poprzednim filmie, XGBoost osiąga wysoką wydajność dzięki własnej, zoptymalizowanej strukturze danych dla zbiorów danych – obiektowi DMatrix.

W poprzednim ćwiczeniu dane wejściowe były konwertowane do formatu DMatrix automatycznie. Jednak podczas korzystania z obiektu cv biblioteki xgboost musisz najpierw jawnie przekształcić dane do formatu DMatrix. Właśnie to zrobisz tutaj, zanim uruchomisz walidację krzyżową na zbiorze churn_data.

Instrukcje

100 XP
  • Utwórz obiekt DMatrix o nazwie churn_dmatrix ze zbioru churn_data, używając funkcji xgb.DMatrix(). Cechy są dostępne w zmiennej X, a etykiety w zmiennej y.
  • Wykonaj 3-krotną walidację krzyżową, wywołując funkcję xgb.cv(). Parametr dtrain to twój obiekt churn_dmatrix, params to słownik parametrów, nfold to liczba podziałów walidacji krzyżowej (3), num_boost_round to liczba drzew do zbudowania (5), natomiast metrics to metryka, którą chcesz obliczyć (w tym przypadku "error", którą następnie przekształcimy na wartość dokładności).