Mulai sekarangMulai gratis

Standardization

Walau normalisasi berguna untuk menskalakan sebuah kolom di antara dua titik data, membandingkan dua kolom yang telah diskalakan menjadi sulit jika salah satunya sangat dipengaruhi oleh pencilan. Solusi yang umum digunakan adalah standardization, yaitu alih-alih memiliki batas atas dan bawah yang kaku, Anda memusatkan data pada nilai mean-nya, lalu menghitung berapa banyak simpangan baku setiap titik data dari mean.

Latihan ini merupakan bagian dari kursus

Rekayasa Fitur untuk Machine Learning di Python

Lihat Kursus

Instruksi latihan

  • Impor StandardScaler dari modul preprocessing milik sklearn.
  • Instansiasikan StandardScaler() sebagai SS_scaler.
  • Fit StandardScaler pada kolom Age dari so_numeric_df.
  • Transformasikan kolom yang sama dengan pengubah skala (scaler) yang baru saja Anda fit.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import StandardScaler
____

# Instantiate StandardScaler
SS_scaler = ____()

# Fit SS_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_SS'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_SS', 'Age']].head())
Edit dan Jalankan Kode