Uçuşlar için lineer regresyonu optimize etme
Şimdiye kadar modellerini kurarken varsayılan hiper parametreleri kullanıyordun. Bu egzersizde, model hiper parametrelerinin en iyi (ya da en iyiye yakın) kümesini seçmek için çapraz doğrulamayı kullanacaksın.
Aşağıdakiler zaten oluşturuldu:
regression— birLinearRegressionnesnesipipeline— string indexer, one-hot encoder, vector assembler ve linear regression içeren bir pipeline veevaluator— birRegressionEvaluatornesnesi.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bir parametre grid builder oluştur.
regression.regParam(değerler 0.01, 0.1, 1.0 ve 10.0) veregression.elasticNetParam(değerler 0.0, 0.5 ve 1.0) için gridler ekle.- Grid'i oluştur (build et).
- Beş katlı olacak şekilde bir çapraz doğrulayıcı (cross validator) oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create parameter grid
params = ____()
# Add grids for two parameters
params = params.____(____, ____) \
.____(____, ____)
# Build the parameter grid
params = params.____()
print('Number of models to be tested: ', len(params))
# Create cross-validator
cv = ____(estimator=____, estimatorParamMaps=____, evaluator=____, ____)