BaşlayınÜcretsiz başlayın

Standardizasyon pratiği

Bilinmeyen dağılımlarda KNN'i körlemesine kullanmak tehlikelidir. Özellik dağılımlarının ölçekleri aynı olmadığında performansı ciddi şekilde düşer. Ölçeklenmemiş özellikler, mesafe hesaplarını çarpıtır ve gerçekçi olmayan aykırı değer puanları döndürür.

Bunu dengelemek için yaygın bir teknik standardizasyondur. Bu, bir özellikten ortalamayı çıkarıp standart sapmaya bölmeyi içerir. Böylece özelliğin ortalaması 0, varyansı 1 olur.

Daha önce senin için yüklenmiş olan females veri kümesi üzerinde standardizasyon pratiği yap.

Bu egzersiz, kursun bir parçasıdır

Python ile Anomali Tespiti

Kursa Göz Atın

Egzersiz talimatları

  • Bir StandardScaler() örneği oluştur ve ss olarak sakla.
  • Özellik ve hedef dizilerini X ve y olarak çıkar. Hedef weightkg sütunudur.
  • StandardScaler()'ı X'e uygula ve aynı anda dönüştür.
  • Yukarıdaki işlemi tekrarla ama bu kez X DataFrame'inin sütun adlarını koru.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

from sklearn.preprocessing import StandardScaler

# Initialize a StandardScaler
ss = ____

# Extract feature and target arrays
X = ____ 
y = ____

# Fit/transform X
X_transformed = ____

# Fit/transform X but preserve the column names
X.____ = ____
Kodu Düzenle ve Çalıştır