MulaiMulai sekarang secara gratis

Normalisasi variabel

Sekarang, untuk langkah terakhir dalam menyiapkan data. Anda akan mentransformasi himpunan data tanpa kemencengan wholesale_boxcox ke skala yang sama, artinya semua kolom memiliki mean nol dan standar deviasi 1. Anda akan menggunakan fungsi StandardScaler dari modul sklearn.preprocessing.

Himpunan data tanpa kemencengan wholesale_coxbox yang telah Anda transformasi pada latihan sebelumnya telah diimpor sebagai DataFrame pandas. Selain itu, instance StandardScaler() telah diinisialisasi sebagai scaler.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Petunjuk latihan

  • Lakukan fit pada instance scaler yang telah diinisialisasi menggunakan himpunan data yang telah ditransformasi Box-Cox.
  • Transformasikan dan simpan himpunan data yang telah diskalakan sebagai wholesale_scaled.
  • Buat sebuah DataFrame pandas dari himpunan data yang telah diskalakan.
  • Cetak nilai mean dan standar deviasi untuk semua kolom.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())
Edit dan Jalankan Kode