BaşlayınÜcretsiz Başlayın

Şarkı popülerliğini tahmin etmek için pipeline

Son egzersizde, eksik değerleri atamak (impute), özellikleri ölçeklemek ve bir lojistik regresyon modelinin hiperparametre ayarlamasını yapmak için bir pipeline kuracaksın. Amaç, şarkı türünü tahmin ederken en iyi parametreleri ve doğruluğu bulmak!

Pipeline’ı kurmak için gereken tüm modeller ve nesneler senin için önceden yüklendi.

Bu egzersiz

scikit-learn ile Supervised Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir simple imputer, bir standard scaler ve bir lojistik regresyon modeli çağırarak pipeline adımlarını oluştur.
  • Bir pipeline nesnesi oluştur ve steps değişkenini geçir.
  • Pipeline ve parametreleri kullanarak çapraz doğrulama yapacak bir grid search nesnesi oluştur.
  • En iyi parametreleri yazdır ve grid search nesnesi için test kümesi doğruluk skorunu hesaplayıp yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create steps
steps = [("imp_mean", ____()), 
         ("scaler", ____()), 
         ("logreg", ____())]

# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
         "logreg__C": np.linspace(0.001, 1.0, 10)}

# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)

# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))
Kodu Düzenle ve Çalıştır