Şarkı popülerliğini tahmin etmek için pipeline
Son egzersizde, eksik değerleri atamak (impute), özellikleri ölçeklemek ve bir lojistik regresyon modelinin hiperparametre ayarlamasını yapmak için bir pipeline kuracaksın. Amaç, şarkı türünü tahmin ederken en iyi parametreleri ve doğruluğu bulmak!
Pipeline’ı kurmak için gereken tüm modeller ve nesneler senin için önceden yüklendi.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bir simple imputer, bir standard scaler ve bir lojistik regresyon modeli çağırarak pipeline adımlarını oluştur.
- Bir pipeline nesnesi oluştur ve
stepsdeğişkenini geçir. - Pipeline ve parametreleri kullanarak çapraz doğrulama yapacak bir grid search nesnesi oluştur.
- En iyi parametreleri yazdır ve grid search nesnesi için test kümesi doğruluk skorunu hesaplayıp yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create steps
steps = [("imp_mean", ____()),
("scaler", ____()),
("logreg", ____())]
# Set up pipeline
pipeline = ____(____)
params = {"logreg__solver": ["newton-cg", "saga", "lbfgs"],
"logreg__C": np.linspace(0.001, 1.0, 10)}
# Create the GridSearchCV object
tuning = ____(____, param_grid=____)
tuning.fit(X_train, y_train)
y_pred = tuning.predict(X_test)
# Compute and print performance
print("Tuned Logistic Regression Parameters: {}, Accuracy: {}".format(____.____, ____.____))