Mengombinasikan metode prapemrosesan
Argumen preProcess pada train() tidak hanya membatasi Anda pada imputasi nilai hilang. Argumen ini juga mencakup beragam teknik preProcess lain yang membuat pekerjaan Anda sebagai data scientist jauh lebih mudah. Anda dapat membaca daftar lengkapnya dengan mengetik ?preProcess dan membaca halaman bantuan untuk fungsi ini.
Satu set fungsi prapemrosesan yang sangat berguna untuk memfitting model regresi adalah standardisasi: centering dan scaling. Pertama, Anda melakukan centering dengan mengurangkan mean setiap kolom dari setiap nilai pada kolom tersebut, lalu Anda melakukan scaling dengan membagi dengan simpangan baku.
Standardisasi mentransformasi data Anda sehingga untuk setiap kolom, mean bernilai 0 dan simpangan baku bernilai 1. Hal ini memudahkan model regresi menemukan solusi yang baik.
Latihan ini merupakan bagian dari kursus
Machine Learning dengan caret di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Fit glm with median imputation
model <- train(
x = ___,
y = ___,
method = ___,
trControl = myControl,
preProcess = ___
)
# Print model