BaşlayınÜcretsiz başlayın

Uçuşlar için lineer regresyonu optimize etme

Şimdiye kadar modellerini kurarken varsayılan hiper parametreleri kullanıyordun. Bu egzersizde, model hiper parametrelerinin en iyi (ya da en iyiye yakın) kümesini seçmek için çapraz doğrulamayı kullanacaksın.

Aşağıdakiler zaten oluşturuldu:

  • regression — bir LinearRegression nesnesi
  • pipeline — string indexer, one-hot encoder, vector assembler ve linear regression içeren bir pipeline ve
  • evaluator — bir RegressionEvaluator nesnesi.

Bu egzersiz, kursun bir parçasıdır

PySpark ile Machine Learning

Kursa Göz Atın

Egzersiz talimatları

  • Bir parametre grid builder oluştur.
  • regression.regParam (değerler 0.01, 0.1, 1.0 ve 10.0) ve regression.elasticNetParam (değerler 0.0, 0.5 ve 1.0) için gridler ekle.
  • Grid'i oluştur (build et).
  • Beş katlı olacak şekilde bir çapraz doğrulayıcı (cross validator) oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create parameter grid
params = ____()

# Add grids for two parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))

# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)
Kodu Düzenle ve Çalıştır