Standardizasyon pratiği
Bilinmeyen dağılımlarda KNN'i körlemesine kullanmak tehlikelidir. Özellik dağılımlarının ölçekleri aynı olmadığında performansı ciddi şekilde düşer. Ölçeklenmemiş özellikler, mesafe hesaplarını çarpıtır ve gerçekçi olmayan aykırı değer puanları döndürür.
Bunu dengelemek için yaygın bir teknik standardizasyondur. Bu, bir özellikten ortalamayı çıkarıp standart sapmaya bölmeyi içerir. Böylece özelliğin ortalaması 0, varyansı 1 olur.
Daha önce senin için yüklenmiş olan females veri kümesi üzerinde standardizasyon pratiği yap.
Bu egzersiz
Python ile Anomali Tespiti
kursunun bir parçasıdırEgzersiz talimatları
- Bir
StandardScaler()örneği oluştur vessolarak sakla. - Özellik ve hedef dizilerini
Xveyolarak çıkar. Hedefweightkgsütunudur. StandardScaler()'ı X'e uygula ve aynı anda dönüştür.- Yukarıdaki işlemi tekrarla ama bu kez
XDataFrame'inin sütun adlarını koru.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.preprocessing import StandardScaler
# Initialize a StandardScaler
ss = ____
# Extract feature and target arrays
X = ____
y = ____
# Fit/transform X
X_transformed = ____
# Fit/transform X but preserve the column names
X.____ = ____