Pemusatan dan penskalaan untuk regresi
Sekarang Anda telah melihat manfaat penskalaan data, Anda akan menggunakan pipeline untuk praproses fitur music_df dan membangun model regresi lasso untuk memprediksi tingkat kebisingan (loudness) lagu.
X_train, X_test, y_train, dan y_test telah dibuat dari himpunan data music_df, dengan target "loudness" dan fitur adalah semua kolom lainnya dalam himpunan data. Lasso dan Pipeline juga telah diimpor untuk Anda.
Perhatikan bahwa "genre" telah dikonversi menjadi fitur biner, di mana 1 menunjukkan lagu rock, dan 0 mewakili genre lainnya.
Latihan ini adalah bagian dari kursus
Supervised Learning dengan scikit-learn
Petunjuk latihan
- Impor
StandardScaler. - Buat langkah-langkah untuk objek pipeline: sebuah objek
StandardScalerbernama"scaler", dan model lasso bernama"lasso"denganalphadisetel ke0.5. - Buat instance pipeline dengan langkah-langkah untuk melakukan penskalaan dan membangun model regresi lasso.
- Hitung nilai R-squared pada data uji.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))