Standardizasyon pratiği
Bilinmeyen dağılımlarda KNN'i körlemesine kullanmak tehlikelidir. Özellik dağılımlarının ölçekleri aynı olmadığında performansı ciddi şekilde düşer. Ölçeklenmemiş özellikler, mesafe hesaplarını çarpıtır ve gerçekçi olmayan aykırı değer puanları döndürür.
Bunu dengelemek için yaygın bir teknik standardizasyondur. Bu, bir özellikten ortalamayı çıkarıp standart sapmaya bölmeyi içerir. Böylece özelliğin ortalaması 0, varyansı 1 olur.
Daha önce senin için yüklenmiş olan females veri kümesi üzerinde standardizasyon pratiği yap.
Bu egzersiz, kursun bir parçasıdır
Python ile Anomali Tespiti
Egzersiz talimatları
- Bir
StandardScaler()örneği oluştur vessolarak sakla. - Özellik ve hedef dizilerini
Xveyolarak çıkar. Hedefweightkgsütunudur. StandardScaler()'ı X'e uygula ve aynı anda dönüştür.- Yukarıdaki işlemi tekrarla ama bu kez
XDataFrame'inin sütun adlarını koru.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
from sklearn.preprocessing import StandardScaler
# Initialize a StandardScaler
ss = ____
# Extract feature and target arrays
X = ____
y = ____
# Fit/transform X
X_transformed = ____
# Fit/transform X but preserve the column names
X.____ = ____