Standardizasyon
Normalizasyon, bir sütunu iki veri noktası arasında ölçeklemek için işe yarayabilir; ancak sütunlardan biri aykırı değerlerden aşırı etkilenirse, iki ölçeklenmiş sütunu karşılaştırmak zorlaşır. Buna yaygın bir çözüm standardizasyon olarak bilinir. Burada katı bir alt ve üst sınır yerine, veriyi ortalaması etrafında merkezlersin ve her bir veri noktasının ortalamadan kaç standart sapma uzakta olduğunu hesaplarsın.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Egzersiz talimatları
sklearn'ınpreprocessingmodülündenStandardScaler'ı içe aktar.StandardScaler()'ıSS_scalerolarak örnekle.so_numeric_df'inAgesütunundaStandardScaler'ı fit et.- Az önce fit ettiğin ölçekleyiciyle aynı sütunu dönüştür.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import StandardScaler
____
# Instantiate StandardScaler
SS_scaler = ____()
# Fit SS_scaler to the data
____.____(so_numeric_df[['Age']])
# Transform the data using the fitted scaler
so_numeric_df['Age_SS'] = ____.____(so_numeric_df[['Age']])
# Compare the origional and transformed column
print(so_numeric_df[['Age_SS', 'Age']].head())