Model(ler)i eğit
Nihayet modelleri eğitmeye ve en iyisini seçmeye hazırsın!
Ne yazık ki, çapraz doğrulama oldukça fazla hesaplama gerektirir. Tüm modelleri eğitmek DataCamp üzerinde çok uzun sürerdi.
Bunu yerelde yapmak için şu kodu kullanırdın:
# Çapraz doğrulama modellerini eğit
models = cv.fit(training)
# En iyi modeli çıkar
best_lr = models.bestModel
Unutma, eğitim verisinin adı training ve lojistik regresyon modelini eğitmek için lr kullanıyorsun. Çapraz doğrulama en iyi parametre değerleri olarak regParam=0 ve elasticNetParam=0 değerlerini seçti. Bunlar varsayılan değerlerdir, bu yüzden modeli eğitmeden önce lr ile ekstra bir şey yapmana gerek yok.
Bu egzersiz
PySpark Temelleri
kursunun bir parçasıdırEgzersiz talimatları
trainingverisi üzerindelr.fit()çağırarakbest_lroluştur.best_lröğesini yazdır veLogisticRegressionModelsınıfından bir nesne olduğunu doğrula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Call lr.fit()
best_lr = ____
# Print best_lr
print(____)