1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Przeszukiwanie siatki hiperparametrów

W poprzedniej lekcji zbudowaliśmy bazowy model Gradient Boosting. Twoim zadaniem jest teraz znalezienie najlepszej wartości hiperparametru max_depth dla tego modelu. Hiperparametr ten ogranicza liczbę węzłów w każdym pojedynczym drzewie. Do oceny lokalnej wydajności modelu dla każdej wartości hiperparametru użyjesz kroswalidacji K-fold.

Do dyspozycji masz funkcję get_cv_score(), która przyjmuje zbiór treningowy oraz słownik parametrów modelu, a zwraca ogólny wynik RMSE na zbiorze walidacyjnym dla kroswalidacji 3-fold.

Instrukcje

100 XP
  • Zdefiniuj siatkę możliwych wartości max_depth: 3, 6, 9, 12 i 15.
  • Przekaż każdy kandydujący hiperparametr z siatki do słownika parametrów modelu params.