Normalisasi
Seperti dibahas dalam video, pada normalisasi Anda melakukan penskalaan linear seluruh kolom ke rentang 0 hingga 1, dengan 0 mewakili nilai terendah di kolom, dan 1 mewakili nilai tertinggi.
Saat menggunakan scikit-learn (pustaka Machine Learning paling umum di Python), Anda dapat menggunakan MinMaxScaler untuk menerapkan normalisasi.
(Disebut demikian karena penskalaan nilai Anda dilakukan antara nilai minimum dan maksimum.)
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Petunjuk latihan
- Impor
MinMaxScalerdari modulpreprocessingmiliksklearn. - Instansiasikan
MinMaxScaler()sebagaiMM_scaler. - Lakukan fit
MinMaxScalerpada kolomAgedariso_numeric_df. - Transformasikan kolom yang sama dengan scaler yang baru saja Anda fit.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import MinMaxScaler
____
# Instantiate MinMaxScaler
MM_scaler = ____()
# Fit MM_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_MM'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_MM', 'Age']].head())