BaşlayınÜcretsiz Başlayın

Sınıflandırma için merkezleme ve ölçekleme

Şimdi ölçekleme ve model kurmayı çapraz doğrulama için bir pipeline içinde bir araya getireceksin.

Görevin, music_df veri kümesindeki özellikleri ölçekleyen ve lojistik regresyon modeli için C hiperparametresinin farklı değerleriyle ızgara araması çapraz doğrulaması yapan bir pipeline kurmak. Buradaki hedef değişken "genre"; rock için ikili değer 1, diğer tüm türler için 0 içerir.

StandardScaler, LogisticRegression ve GridSearchCV senin için içe aktarıldı.

Bu egzersiz

scikit-learn ile Supervised Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Pipeline adımlarını kur: "scaler" adlı bir StandardScaler() nesnesi ve "logreg" adlı bir lojistik regresyon modeli.
  • Pipeline içindeki lojistik regresyon modelinin C hiperparametresi için 0.001 ile 1.0 arasında eşit aralıklı 20 kayan nokta değeri arayacak parameters sözlüğünü oluştur.
  • Izgara araması nesnesini oluştur.
  • Izgara araması nesnesini eğitim verilerine uydur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Build the steps
steps = [("____", ____()),
         ("____", ____())]
pipeline = Pipeline(steps)

# Create the parameter space
parameters = {"____": np.____(____, ____, 20)}
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, 
                                                    random_state=21)

# Instantiate the grid search object
cv = ____(____, param_grid=____)

# Fit to the training data
cv.____(____, ____)
print(cv.best_score_, "\n", cv.best_params_)
Kodu Düzenle ve Çalıştır