SMS spam optimize edildi
SMS spam modeli için daha önce kurduğun pipeline, içindeki tüm bileşenler için varsayılan parametreleri kullanıyordu. Ancak bu parametrelerin özellikle iyi bir model vermesi pek olası değil. Bu egzersizde pipeline’ı seçili parametre değerleri için çalıştıracaksın. Bunu sistematik bir şekilde yapacağız: her hiperparametre için değerler bir ızgaraya yerleştirilecek ve pipeline ızgaradaki her noktada sırayla çalışacak.
Bu egzersizde, SMS spam sınıflandırıcısı için çapraz doğrulama ile iyi bir parametre seti seçmekte kullanılacak bir parametre ızgarası kuracaksın.
Aşağıdakiler zaten tanımlı:
hasher— birHashingTFnesnesi velogistic— birLogisticRegressionnesnesi.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bir parametre ızgarası (grid) oluşturucu nesnesi yarat.
HashingTFnesnesine aitnumFeaturesvebinaryparametreleri için ızgara noktaları ekle; sırasıyla 1024, 4096 ve 16384 ile True ve False değerlerini ver.LogisticRegressionnesnesine aitregParamveelasticNetParamparametreleri için ızgara noktaları ekle; sırasıyla 0.01, 0.1, 1.0 ve 10.0 ile 0.0, 0.5 ve 1.0 değerlerini ver.- Parametre ızgarasını oluştur (build).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create parameter grid
params = ____()
# Add grid for hashing trick parameters
params = params.____(____, ____) \
.____(____, ____)
# Add grid for logistic regression parameters
params = params.____(____, ____) \
.____(____, ____)
# Build parameter grid
params = ____.____()