MulaiMulai sekarang secara gratis

Mentransformasi data pelatihan secara lazy

Prapemrosesan variabel masukan adalah langkah penting dalam Machine Learning dan sering kali meningkatkan akurasi model yang Anda buat. Pada dua latihan terakhir, data Spotify sudah dipraproses untuk Anda, tetapi penting bagi Anda untuk mengetahui cara melakukannya sendiri.

Pada latihan ini, Anda akan menggunakan objek scaler StandardScaler(), yang mentransformasi kolom-kolom dalam sebuah array sehingga memiliki mean nol dan standar deviasi satu.

Dask DataFrame dari lagu-lagu Spotify tersedia di lingkungan Anda sebagai dask_df. Data ini mencakup skor popularitas target dan variabel masukan yang Anda gunakan untuk memprediksi skor tersebut.

Latihan ini adalah bagian dari kursus

Pemrograman Paralel dengan Dask di Python

Lihat Kursus

Petunjuk latihan

  • Impor kelas StandardScaler() dari dask_ml.preprocessing.
  • Pilih kolom 'popularity' dari DataFrame dan tetapkan ke variabel y.
  • Buat objek StandardScaler dan fit ke data X.
  • Gunakan scaler untuk mentransformasi X.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the StandardScaler class
from ____ import ____

X = dask_df[['duration_ms', 'explicit', 'danceability', 'acousticness', 'instrumentalness', 'tempo']]

# Select the target variable
y = ____

# Create a StandardScaler object and fit it on X
scaler = ____
scaler.____(____)

# Transform X
X = scaler.____
print(X)
Edit dan Jalankan Kode