BaşlayınÜcretsiz başlayın

Eğitim ve test dönüşümleri (II)

Eğitim ve test kümelerine aynı ölçekleyiciyi uygulamaya benzer şekilde, eğer eğitim kümesinden aykırı değerleri kaldırdıysan, muhtemelen test kümesinde de aynısını yapmak istersin. Yine, test kümesinden aykırı değerleri kaldırırken yalnızca eğitim kümesinden hesaplanan eşik değerleri kullandığından emin olmalısın.

Son egzersize benzer şekilde, so_numeric_df DataFrame'ini eğitim (so_train_numeric) ve test (so_test_numeric) kümelerine ayırdık.

Bu egzersiz, kursun bir parçasıdır

Python ile Machine Learning için Özellik Mühendisliği

Kursa Göz Atın

Egzersiz talimatları

  • ConvertedSalary sütununun standart sapmasını ve ortalamasını hesapla.
  • Üst ve alt sınırları, ortalamadan her iki yönde üç standart sapma uzaklıkta olacak şekilde hesapla.
  • so_test_numeric DataFrame'ini, ConvertedSalary değeri alt ve üst sınırlar içinde kalan tüm satırları tutacak şekilde kırp.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

train_std = so_train_numeric['ConvertedSalary'].____
train_mean = so_train_numeric['ConvertedSalary'].____

cut_off = train_std * 3
train_lower, train_upper = ____, train_mean + cut_off

# Trim the test DataFrame
trimmed_df = so_test_numeric[(so_test_numeric['ConvertedSalary'] < ____) \
                             & (so_test_numeric['ConvertedSalary'] > ____)]
Kodu Düzenle ve Çalıştır