1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

2D grid search

Nevýhodou samostatného ladění každého hyperparametru je možná závislost mezi různými hyperparametry. Lepší přístup je vyzkoušet všechny možné kombinace hyperparametrů. V takovém případě ale prostor pro grid search rychle roste. Například při 2 parametrech s 10 možnými hodnotami to dá 100 experimentálních běhů.

Tvým cílem je najít nejlepší kombinaci hyperparametrů max_depth a subsample pro model Gradient Boosting. subsample je podíl pozorování použitých k trénování jednotlivých stromů.

Máš k dispozici funkci get_cv_score(), která přijímá trénovací datovou sadu a slovník parametrů modelu a vrací celkové RMSE skóre na validační sadě při 3-fold cross-validaci.

Pokyny

100 XP
  • Definuj mřížky možných hodnot pro max_depth a subsample. Pro max_depth: 3, 5 a 7. Pro subsample: 0,8, 0,9 a 1,0.
  • Na mřížky hyperparametrů použij funkci product() z balíčku itertools. Vrátí všechny možné kombinace těchto dvou mřížek.
  • Každou kandidátní dvojici hyperparametrů předej do slovníku params modelu.