BaşlayınÜcretsiz Başlayın

Uçuşlar için lineer regresyonu optimize etme

Şimdiye kadar modellerini kurarken varsayılan hiper parametreleri kullanıyordun. Bu egzersizde, model hiper parametrelerinin en iyi (ya da en iyiye yakın) kümesini seçmek için çapraz doğrulamayı kullanacaksın.

Aşağıdakiler zaten oluşturuldu:

  • regression — bir LinearRegression nesnesi
  • pipeline — string indexer, one-hot encoder, vector assembler ve linear regression içeren bir pipeline ve
  • evaluator — bir RegressionEvaluator nesnesi.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir parametre grid builder oluştur.
  • regression.regParam (değerler 0.01, 0.1, 1.0 ve 10.0) ve regression.elasticNetParam (değerler 0.0, 0.5 ve 1.0) için gridler ekle.
  • Grid'i oluştur (build et).
  • Beş katlı olacak şekilde bir çapraz doğrulayıcı (cross validator) oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Kodu Düzenle ve Çalıştır