Eğitim ve test dönüşümleri (II)
Eğitim ve test kümelerine aynı ölçekleyiciyi uygulamaya benzer şekilde, eğer eğitim kümesinden aykırı değerleri kaldırdıysan, muhtemelen test kümesinde de aynısını yapmak istersin. Yine, test kümesinden aykırı değerleri kaldırırken yalnızca eğitim kümesinden hesaplanan eşik değerleri kullandığından emin olmalısın.
Son egzersize benzer şekilde, so_numeric_df DataFrame'ini eğitim (so_train_numeric) ve test (so_test_numeric) kümelerine ayırdık.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
ConvertedSalarysütununun standart sapmasını ve ortalamasını hesapla.- Üst ve alt sınırları, ortalamadan her iki yönde üç standart sapma uzaklıkta olacak şekilde hesapla.
so_test_numericDataFrame'ini,ConvertedSalarydeğeri alt ve üst sınırlar içinde kalan tüm satırları tutacak şekilde kırp.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
train_std = so_train_numeric['ConvertedSalary'].____
train_mean = so_train_numeric['ConvertedSalary'].____
cut_off = train_std * 3
train_lower, train_upper = ____, train_mean + cut_off
# Trim the test DataFrame
trimmed_df = so_test_numeric[(so_test_numeric['ConvertedSalary'] < ____) \
& (so_test_numeric['ConvertedSalary'] > ____)]