BaşlayınÜcretsiz Başlayın

Standardizasyon pratiği

Bilinmeyen dağılımlarda KNN'i körlemesine kullanmak tehlikelidir. Özellik dağılımlarının ölçekleri aynı olmadığında performansı ciddi şekilde düşer. Ölçeklenmemiş özellikler, mesafe hesaplarını çarpıtır ve gerçekçi olmayan aykırı değer puanları döndürür.

Bunu dengelemek için yaygın bir teknik standardizasyondur. Bu, bir özellikten ortalamayı çıkarıp standart sapmaya bölmeyi içerir. Böylece özelliğin ortalaması 0, varyansı 1 olur.

Daha önce senin için yüklenmiş olan females veri kümesi üzerinde standardizasyon pratiği yap.

Bu egzersiz

Python ile Anomali Tespiti

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir StandardScaler() örneği oluştur ve ss olarak sakla.
  • Özellik ve hedef dizilerini X ve y olarak çıkar. Hedef weightkg sütunudur.
  • StandardScaler()'ı X'e uygula ve aynı anda dönüştür.
  • Yukarıdaki işlemi tekrarla ama bu kez X DataFrame'inin sütun adlarını koru.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.preprocessing import StandardScaler

# Initialize a StandardScaler
ss = ____

# Extract feature and target arrays
X = ____ 
y = ____

# Fit/transform X
X_transformed = ____

# Fit/transform X but preserve the column names
X.____ = ____
Kodu Düzenle ve Çalıştır