BaşlayınÜcretsiz Başlayın

Regresyon için merkezleme ve ölçekleme

Artık verilerini ölçeklemenin faydalarını gördüğüne göre, bir pipeline kullanarak music_df özniteliklerini ön işlemeden geçirip bir lasso regresyon modeli kurarak bir şarkının ses yüksekliğini (loudness) tahmin edeceksin.

X_train, X_test, y_train ve y_test, hedef değişkeni "loudness" olan ve öznitelikleri veri kümesindeki diğer tüm sütunlar olan music_df veri kümesinden oluşturuldu. Lasso ve Pipeline da senin için içe aktarıldı.

Not: "genre", 1 rock şarkısını, 0 ise diğer türleri temsil eden ikili (binary) bir özelliğe dönüştürüldü.

Bu egzersiz

scikit-learn ile Supervised Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • StandardScaler'ı içe aktar.
  • Pipeline nesnesi için adımları oluştur: "scaler" adında bir StandardScaler nesnesi ve alpha değeri 0.5 olan "lasso" isimli bir lasso modeli.
  • Ölçekleme ve lasso regresyon modeli kurma adımlarını içeren bir pipeline oluştur.
  • Test verisi üzerinde R-kare değerini hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import StandardScaler
____

# Create pipeline steps
steps = [("____", ____()),
         ("____", ____(alpha=____))]

# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)

# Calculate and print R-squared
print(____.____(____, ____))
Kodu Düzenle ve Çalıştır