MulaiMulai sekarang secara gratis

Pemusatan dan penskalaan untuk regresi

Sekarang Anda telah melihat manfaat penskalaan data, Anda akan menggunakan pipeline untuk praproses fitur music_df dan membangun model regresi lasso untuk memprediksi tingkat kebisingan (loudness) lagu.

X_train, X_test, y_train, dan y_test telah dibuat dari himpunan data music_df, dengan target "loudness" dan fitur adalah semua kolom lainnya dalam himpunan data. Lasso dan Pipeline juga telah diimpor untuk Anda.

Perhatikan bahwa "genre" telah dikonversi menjadi fitur biner, di mana 1 menunjukkan lagu rock, dan 0 mewakili genre lainnya.

Latihan ini adalah bagian dari kursus

Supervised Learning dengan scikit-learn

Lihat Kursus

Petunjuk latihan

  • Impor StandardScaler.
  • Buat langkah-langkah untuk objek pipeline: sebuah objek StandardScaler bernama "scaler", dan model lasso bernama "lasso" dengan alpha disetel ke 0.5.
  • Buat instance pipeline dengan langkah-langkah untuk melakukan penskalaan dan membangun model regresi lasso.
  • Hitung nilai R-squared pada data uji.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import StandardScaler
____

# Create pipeline steps
steps = [("____", ____()),
         ("____", ____(alpha=____))]

# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)

# Calculate and print R-squared
print(____.____(____, ____))
Edit dan Jalankan Kode