BaşlayınÜcretsiz başlayın

Standardizasyon

Normalizasyon, bir sütunu iki veri noktası arasında ölçeklemek için işe yarayabilir; ancak sütunlardan biri aykırı değerlerden aşırı etkilenirse, iki ölçeklenmiş sütunu karşılaştırmak zorlaşır. Buna yaygın bir çözüm standardizasyon olarak bilinir. Burada katı bir alt ve üst sınır yerine, veriyi ortalaması etrafında merkezlersin ve her bir veri noktasının ortalamadan kaç standart sapma uzakta olduğunu hesaplarsın.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

  • sklearn'ın preprocessing modülünden StandardScaler'ı içe aktar.
  • StandardScaler()SS_scaler olarak örnekle.
  • so_numeric_df'in Age sütununda StandardScaler'ı fit et.
  • Az önce fit ettiğin ölçekleyiciyle aynı sütunu dönüştür.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import StandardScaler
____

# Instantiate StandardScaler
SS_scaler = ____()

# Fit SS_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_SS'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_SS', 'Age']].head())
Kodu Düzenle ve Çalıştır