Eğitim ve test dönüşümleri (II)
Eğitim ve test kümelerine aynı ölçekleyiciyi uygulamaya benzer şekilde, eğer eğitim kümesinden aykırı değerleri kaldırdıysan, muhtemelen test kümesinde de aynısını yapmak istersin. Yine, test kümesinden aykırı değerleri kaldırırken yalnızca eğitim kümesinden hesaplanan eşik değerleri kullandığından emin olmalısın.
Son egzersize benzer şekilde, so_numeric_df DataFrame'ini eğitim (so_train_numeric) ve test (so_test_numeric) kümelerine ayırdık.
Bu egzersiz, kursun bir parçasıdır
Python ile Machine Learning için Özellik Mühendisliği
Egzersiz talimatları
ConvertedSalarysütununun standart sapmasını ve ortalamasını hesapla.- Üst ve alt sınırları, ortalamadan her iki yönde üç standart sapma uzaklıkta olacak şekilde hesapla.
so_test_numericDataFrame'ini,ConvertedSalarydeğeri alt ve üst sınırlar içinde kalan tüm satırları tutacak şekilde kırp.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
train_std = so_train_numeric['ConvertedSalary'].____
train_mean = so_train_numeric['ConvertedSalary'].____
cut_off = train_std * 3
train_lower, train_upper = ____, train_mean + cut_off
# Trim the test DataFrame
trimmed_df = so_test_numeric[(so_test_numeric['ConvertedSalary'] < ____) \
& (so_test_numeric['ConvertedSalary'] > ____)]