Normalisasi variabel
Sekarang, untuk langkah terakhir dalam menyiapkan data. Anda akan mentransformasi himpunan data tanpa kemencengan wholesale_boxcox ke skala yang sama, artinya semua kolom memiliki mean nol dan standar deviasi 1. Anda akan menggunakan fungsi StandardScaler dari modul sklearn.preprocessing.
Himpunan data tanpa kemencengan wholesale_coxbox yang telah Anda transformasi pada latihan sebelumnya telah diimpor sebagai DataFrame pandas. Selain itu, instance StandardScaler() telah diinisialisasi sebagai scaler.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Lakukan fit pada instance
scaleryang telah diinisialisasi menggunakan himpunan data yang telah ditransformasi Box-Cox. - Transformasikan dan simpan himpunan data yang telah diskalakan sebagai
wholesale_scaled. - Buat sebuah DataFrame
pandasdari himpunan data yang telah diskalakan. - Cetak nilai mean dan standar deviasi untuk semua kolom.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())