Mulai sekarangMulai gratis

Latihan standardisasi

Berbahaya menggunakan KNN secara membabi buta pada sebaran yang tidak dikenal. Kinerjanya akan sangat menurun ketika sebaran fitur tidak berada pada skala yang sama. Fitur yang tidak diskalakan akan mengacaukan perhitungan jarak dan menghasilkan skor anomali yang tidak realistis.

Teknik umum untuk mengatasinya adalah standardisasi, yaitu mengurangkan mean dari suatu fitur lalu membaginya dengan simpangan baku. Dampaknya, fitur akan memiliki mean 0 dan varians 1.

Latih standardisasi pada himpunan data females, yang sudah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Deteksi Anomali dengan Python

Lihat Kursus

Instruksi latihan

  • Buat instance StandardScaler() dan simpan sebagai ss.
  • Ekstrak array fitur dan target ke X dan y. Targetnya adalah kolom weightkg.
  • Fit StandardScaler() ke X dan transformasikan sekaligus.
  • Ulangi proses di atas, tetapi pertahankan nama kolom pada DataFrame X.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

from sklearn.preprocessing import StandardScaler

# Initialize a StandardScaler
ss = ____

# Extract feature and target arrays
X = ____ 
y = ____

# Fit/transform X
X_transformed = ____

# Fit/transform X but preserve the column names
X.____ = ____
Edit dan Jalankan Kode