SMS spam optimize edildi
SMS spam modeli için daha önce kurduğun pipeline, içindeki tüm bileşenler için varsayılan parametreleri kullanıyordu. Ancak bu parametrelerin özellikle iyi bir model vermesi pek olası değil. Bu egzersizde pipeline’ı seçili parametre değerleri için çalıştıracaksın. Bunu sistematik bir şekilde yapacağız: her hiperparametre için değerler bir ızgaraya yerleştirilecek ve pipeline ızgaradaki her noktada sırayla çalışacak.
Bu egzersizde, SMS spam sınıflandırıcısı için çapraz doğrulama ile iyi bir parametre seti seçmekte kullanılacak bir parametre ızgarası kuracaksın.
Aşağıdakiler zaten tanımlı:
hasher— birHashingTFnesnesi velogistic— birLogisticRegressionnesnesi.
Bu egzersiz, kursun bir parçasıdır
PySpark ile Machine Learning
Egzersiz talimatları
- Bir parametre ızgarası (grid) oluşturucu nesnesi yarat.
HashingTFnesnesine aitnumFeaturesvebinaryparametreleri için ızgara noktaları ekle; sırasıyla 1024, 4096 ve 16384 ile True ve False değerlerini ver.LogisticRegressionnesnesine aitregParamveelasticNetParamparametreleri için ızgara noktaları ekle; sırasıyla 0.01, 0.1, 1.0 ve 10.0 ile 0.0, 0.5 ve 1.0 değerlerini ver.- Parametre ızgarasını oluştur (build).
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create parameter grid
params = ____()
# Add grid for hashing trick parameters
params = params.____(____, ____) \
.____(____, ____)
# Add grid for logistic regression parameters
params = params.____(____, ____) \
.____(____, ____)
# Build parameter grid
params = ____.____()