Ön işleme yöntemlerini birleştirme
train() fonksiyonundaki preProcess argümanı seni yalnızca eksik değer atamaya (imputation) sınırlandırmaz. Hayatını bir veri bilimci olarak çok daha kolaylaştıracak çeşitli preProcess tekniklerini de içerir. Tüm listeyi görmek için ?preProcess yazıp bu fonksiyonun yardım sayfasını okuyabilirsin.
Özellikle regresyon modelleri kurarken faydalı olan bir ön işleme seti standartlaştırmadır: ortalama alma (centering) ve ölçekleme (scaling). Önce her sütundaki her değerden o sütunun ortalamasını çıkararak veriyi ortalarsın, sonra da standart sapmaya bölerek ölçeklersin.
Standartlaştırma, verini her sütun için ortalaması 0 ve standart sapması 1 olacak şekilde dönüştürür. Bu da regresyon modellerinin iyi bir çözüm bulmasını kolaylaştırır.
Bu egzersiz, kursun bir parçasıdır
R ile caret kullanarak Machine Learning
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Fit glm with median imputation
model <- train(
x = ___,
y = ___,
method = ___,
trControl = myControl,
preProcess = ___
)
# Print model