1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Wszystko razem

Czas połączyć wszystko, czego się do tej pory nauczyłeś! W tym ostatnim ćwiczeniu kursu połączysz swoje wcześniejsze prace w jeden kompletny potok XGBoost. Dzięki temu utrwalisz wiedzę na temat preprocessingu i potoków w XGBoost.

Wyniki z poprzednich 3 ćwiczeń – obejmujące przetwarzanie danych i konfigurację potoku – zostały wstępnie załadowane. Twoim zadaniem jest przeprowadzenie losowego przeszukiwania i wyznaczenie najlepszych hiperparametrów.

Instrukcje

100 XP
  • Skonfiguruj siatkę parametrów: 'clf__learning_rate' (od 0.05 do 1 z krokiem 0.05), 'clf__max_depth' (od 3 do 10 z krokiem 1) oraz 'clf__n_estimators' (od 50 do 200 z krokiem 50).
  • Używając swojego pipeline jako estymatora, przeprowadź RandomizedSearchCV z 2-krotną walidacją krzyżową i n_iter równym 2. Jako metrykę podaj "roc_auc", a verbose ustaw na 1, aby uzyskać bardziej szczegółowe dane wyjściowe. Wynik zapisz w zmiennej randomized_roc_auc.
  • Dopasuj randomized_roc_auc do danych X i y.
  • Wyznacz najlepszy wynik i najlepszy estymator obiektu randomized_roc_auc.