Eğitim ve test dönüşümleri (I)
Şu ana kadar bir sütuna dayalı ölçekleyiciler oluşturdun ve sonra bu ölçekleyiciyi üzerinde eğitildiği aynı veriye uyguladın. Machine Learning modelleri oluştururken genellikle modellerini geçmiş veriler (eğitim seti) üzerinde kurar ve modelini yeni, daha önce görülmemiş verilere (test seti) uygularsın. Bu durumlarda, hem eğitim hem de test verisine aynı ölçeklemenin uygulandığından emin olman gerekir.
Bunu pratikte yapmak için ölçekleyiciyi eğitim setinde eğitir ve eğitilmiş ölçekleyiciyi test setine uygulamak üzere saklarsın. Bir ölçekleyiciyi asla test seti üzerinde yeniden eğitmemelisin.
Bu egzersiz ve bir sonrakinde, so_numeric_df DataFrame'ini eğitim (so_train_numeric) ve test (so_test_numeric) setlerine böldük.
Bu egzersiz
Python ile Machine Learning için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
StandardScaler()'ıSS_scalerolarak başlat.StandardScaler'ıAgesütununda uydur (fit et).- Test setindeki (
so_test_numeric)Agesütununu dönüştür.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import StandardScaler
from sklearn.preprocessing import StandardScaler
# Apply a standard scaler to the data
SS_scaler = ____
# Fit the standard scaler to the data
____
# Transform the test data using the fitted scaler
so_test_numeric['Age_ss'] = ____
print(so_test_numeric[['Age', 'Age_ss']].head())