Sınıflandırma için merkezleme ve ölçekleme
Şimdi ölçekleme ve model kurmayı çapraz doğrulama için bir pipeline içinde bir araya getireceksin.
Görevin, music_df veri kümesindeki özellikleri ölçekleyen ve lojistik regresyon modeli için C hiperparametresinin farklı değerleriyle ızgara araması çapraz doğrulaması yapan bir pipeline kurmak. Buradaki hedef değişken "genre"; rock için ikili değer 1, diğer tüm türler için 0 içerir.
StandardScaler, LogisticRegression ve GridSearchCV senin için içe aktarıldı.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
- Pipeline adımlarını kur:
"scaler"adlı birStandardScaler()nesnesi ve"logreg"adlı bir lojistik regresyon modeli. - Pipeline içindeki lojistik regresyon modelinin
Chiperparametresi için0.001ile1.0arasında eşit aralıklı 20 kayan nokta değeri arayacakparameterssözlüğünü oluştur. - Izgara araması nesnesini oluştur.
- Izgara araması nesnesini eğitim verilerine uydur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build the steps
steps = [("____", ____()),
("____", ____())]
pipeline = Pipeline(steps)
# Create the parameter space
parameters = {"____": np.____(____, ____, 20)}
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=21)
# Instantiate the grid search object
cv = ____(____, param_grid=____)
# Fit to the training data
cv.____(____, ____)
print(cv.best_score_, "\n", cv.best_params_)