BaşlayınÜcretsiz Başlayın

Standardizasyon

Normalizasyon, bir sütunu iki veri noktası arasında ölçeklemek için işe yarayabilir; ancak sütunlardan biri aykırı değerlerden aşırı etkilenirse, iki ölçeklenmiş sütunu karşılaştırmak zorlaşır. Buna yaygın bir çözüm standardizasyon olarak bilinir. Burada katı bir alt ve üst sınır yerine, veriyi ortalaması etrafında merkezlersin ve her bir veri noktasının ortalamadan kaç standart sapma uzakta olduğunu hesaplarsın.

Bu egzersiz

Python ile Machine Learning için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn'ın preprocessing modülünden StandardScaler'ı içe aktar.
  • StandardScaler()SS_scaler olarak örnekle.
  • so_numeric_df'in Age sütununda StandardScaler'ı fit et.
  • Az önce fit ettiğin ölçekleyiciyle aynı sütunu dönüştür.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import StandardScaler
____

# Instantiate StandardScaler
SS_scaler = ____()

# Fit SS_scaler to the data
____.____(so_numeric_df[['Age']])

# Transform the data using the fitted scaler
so_numeric_df['Age_SS'] = ____.____(so_numeric_df[['Age']])

# Compare the origional and transformed column
print(so_numeric_df[['Age_SS', 'Age']].head())
Kodu Düzenle ve Çalıştır