Uçuşlar için lineer regresyonu optimize etme
Şimdiye kadar modellerini kurarken varsayılan hiper parametreleri kullanıyordun. Bu egzersizde, model hiper parametrelerinin en iyi (ya da en iyiye yakın) kümesini seçmek için çapraz doğrulamayı kullanacaksın.
Aşağıdakiler zaten oluşturuldu:
regression— birLinearRegressionnesnesipipeline— string indexer, one-hot encoder, vector assembler ve linear regression içeren bir pipeline veevaluator— birRegressionEvaluatornesnesi.
Bu egzersiz, kursun bir parçasıdır
PySpark ile Machine Learning
Egzersiz talimatları
- Bir parametre grid builder oluştur.
regression.regParam(değerler 0.01, 0.1, 1.0 ve 10.0) veregression.elasticNetParam(değerler 0.0, 0.5 ve 1.0) için gridler ekle.- Grid'i oluştur (build et).
- Beş katlı olacak şekilde bir çapraz doğrulayıcı (cross validator) oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)