1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z PySpark

Connected

ćwiczenie

Optymalizacja regresji liniowej dla lotów

Do tej pory podczas budowania modeli korzystałeś z domyślnych hiperparametrów. W tym ćwiczeniu użyjesz walidacji krzyżowej, aby wybrać optymalny (lub bliski optymalnemu) zestaw hiperparametrów modelu.

Następujące obiekty zostały już utworzone:

  • regression — obiekt LinearRegression
  • pipeline — potok zawierający indekser łańcuchów, koder one-hot, asembler wektorów i regresję liniową
  • evaluator — obiekt RegressionEvaluator.

Instrukcje

100 XP
  • Utwórz konstruktor siatki parametrów.
  • Dodaj siatki dla regression.regParam (wartości 0.01, 0.1, 1.0 i 10.0) oraz regression.elasticNetParam (wartości 0.0, 0.5 i 1.0).
  • Zbuduj siatkę.
  • Utwórz walidator krzyżowy z pięcioma podziałami.