Standardizasyon
Normalizasyon, bir sütunu iki veri noktası arasında ölçeklemek için işe yarayabilir; ancak sütunlardan biri aykırı değerlerden aşırı etkilenirse, iki ölçeklenmiş sütunu karşılaştırmak zorlaşır. Buna yaygın bir çözüm standardizasyon olarak bilinir. Burada katı bir alt ve üst sınır yerine, veriyi ortalaması etrafında merkezlersin ve her bir veri noktasının ortalamadan kaç standart sapma uzakta olduğunu hesaplarsın.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
sklearn'ınpreprocessingmodülündenStandardScaler'ı içe aktar.StandardScaler()'ıSS_scalerolarak örnekle.so_numeric_df'inAgesütunundaStandardScaler'ı fit et.- Az önce fit ettiğin ölçekleyiciyle aynı sütunu dönüştür.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import StandardScaler
____
# Instantiate StandardScaler
SS_scaler = ____()
# Fit SS_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_SS'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_SS', 'Age']].head())