Regresyon için merkezleme ve ölçekleme
Artık verilerini ölçeklemenin faydalarını gördüğüne göre, bir pipeline kullanarak music_df özniteliklerini ön işlemeden geçirip bir lasso regresyon modeli kurarak bir şarkının ses yüksekliğini (loudness) tahmin edeceksin.
X_train, X_test, y_train ve y_test, hedef değişkeni "loudness" olan ve öznitelikleri veri kümesindeki diğer tüm sütunlar olan music_df veri kümesinden oluşturuldu. Lasso ve Pipeline da senin için içe aktarıldı.
Not: "genre", 1 rock şarkısını, 0 ise diğer türleri temsil eden ikili (binary) bir özelliğe dönüştürüldü.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
StandardScaler'ı içe aktar.- Pipeline nesnesi için adımları oluştur:
"scaler"adında birStandardScalernesnesi vealphadeğeri0.5olan"lasso"isimli bir lasso modeli. - Ölçekleme ve lasso regresyon modeli kurma adımlarını içeren bir pipeline oluştur.
- Test verisi üzerinde R-kare değerini hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))