BaşlayınÜcretsiz Başlayın

Eğitim ve test dönüşümleri (II)

Eğitim ve test kümelerine aynı ölçekleyiciyi uygulamaya benzer şekilde, eğer eğitim kümesinden aykırı değerleri kaldırdıysan, muhtemelen test kümesinde de aynısını yapmak istersin. Yine, test kümesinden aykırı değerleri kaldırırken yalnızca eğitim kümesinden hesaplanan eşik değerleri kullandığından emin olmalısın.

Son egzersize benzer şekilde, so_numeric_df DataFrame'ini eğitim (so_train_numeric) ve test (so_test_numeric) kümelerine ayırdık.

Bu egzersiz

Python ile Machine Learning için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • ConvertedSalary sütununun standart sapmasını ve ortalamasını hesapla.
  • Üst ve alt sınırları, ortalamadan her iki yönde üç standart sapma uzaklıkta olacak şekilde hesapla.
  • so_test_numeric DataFrame'ini, ConvertedSalary değeri alt ve üst sınırlar içinde kalan tüm satırları tutacak şekilde kırp.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

train_std = so_train_numeric['ConvertedSalary'].____
train_mean = so_train_numeric['ConvertedSalary'].____

cut_off = train_std * 3
train_lower, train_upper = ____, train_mean + cut_off

# Trim the test DataFrame
trimmed_df = so_test_numeric[(so_test_numeric['ConvertedSalary'] < ____) \
                             & (so_test_numeric['ConvertedSalary'] > ____)]
Kodu Düzenle ve Çalıştır