1. Nauka
  2. /
  3. Kursy
  4. /
  5. Podstawy PySpark

Connected

ćwiczenie

Dopasowanie modelu (modeli)

Nareszcie czas dopasować modele i wybrać najlepszy!

Niestety, kroswalidacja jest bardzo kosztowną obliczeniowo procedurą. Dopasowanie wszystkich modeli zajęłoby na DataCamp zbyt dużo czasu.

Aby zrobić to lokalnie, możesz skorzystać z poniższego kodu:

# Fit cross validation models
models = cv.fit(training)

# Extract the best model
best_lr = models.bestModel

Pamiętaj, że dane treningowe nazywają się training, a do dopasowania modelu regresji logistycznej używasz lr. Kroswalidacja wskazała wartości parametrów regParam=0 i elasticNetParam=0 jako najlepsze. Są to wartości domyślne, więc przed dopasowaniem modelu nie musisz wprowadzać żadnych dodatkowych zmian w lr.

Instrukcje

100 XP
  • Utwórz best_lr, wywołując lr.fit() na danych training.
  • Wyświetl best_lr, aby sprawdzić, czy jest to obiekt klasy LogisticRegressionModel.