1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

cvičení

Optimalizace lineární regrese pro lety

Dosud jsi při trénování modelů používal/a výchozí hyperparametry. V tomto cvičení využiješ křížovou validaci k výběru optimální (nebo blízko optimální) sady hyperparametrů modelu.

Následující objekty už jsou připravené:

  • regression — objekt třídy LinearRegression
  • pipeline — pipeline obsahující string indexer, one-hot encoder, vector assembler a lineární regresi
  • evaluator — objekt třídy RegressionEvaluator.

Pokyny

100 XP
  • Vytvoř builder mřížky parametrů.
  • Přidej mřížky pro regression.regParam (hodnoty 0.01, 0.1, 1.0 a 10.0) a regression.elasticNetParam (hodnoty 0.0, 0.5 a 1.0).
  • Sestav mřížku.
  • Vytvoř křížový validátor s pěti složeními (folds).