BaşlayınÜcretsiz Başlayın

SMS spam optimize edildi

SMS spam modeli için daha önce kurduğun pipeline, içindeki tüm bileşenler için varsayılan parametreleri kullanıyordu. Ancak bu parametrelerin özellikle iyi bir model vermesi pek olası değil. Bu egzersizde pipeline’ı seçili parametre değerleri için çalıştıracaksın. Bunu sistematik bir şekilde yapacağız: her hiperparametre için değerler bir ızgaraya yerleştirilecek ve pipeline ızgaradaki her noktada sırayla çalışacak.

Bu egzersizde, SMS spam sınıflandırıcısı için çapraz doğrulama ile iyi bir parametre seti seçmekte kullanılacak bir parametre ızgarası kuracaksın.

Aşağıdakiler zaten tanımlı:

  • hasher — bir HashingTF nesnesi ve
  • logistic — bir LogisticRegression nesnesi.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir parametre ızgarası (grid) oluşturucu nesnesi yarat.
  • HashingTF nesnesine ait numFeatures ve binary parametreleri için ızgara noktaları ekle; sırasıyla 1024, 4096 ve 16384 ile True ve False değerlerini ver.
  • LogisticRegression nesnesine ait regParam ve elasticNetParam parametreleri için ızgara noktaları ekle; sırasıyla 0.01, 0.1, 1.0 ve 10.0 ile 0.0, 0.5 ve 1.0 değerlerini ver.
  • Parametre ızgarasını oluştur (build).

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create parameter grid
params = ____()

# Add grid for hashing trick parameters
params = params.____(____, ____) \
               .____(____, ____)

# Add grid for logistic regression parameters
params = params.____(____, ____) \
               .____(____, ____)

# Build parameter grid
params = ____.____()
Kodu Düzenle ve Çalıştır