MulaiMulai sekarang secara gratis

Mengombinasikan metode prapemrosesan

Argumen preProcess pada train() tidak hanya membatasi Anda pada imputasi nilai hilang. Argumen ini juga mencakup beragam teknik preProcess lain yang membuat pekerjaan Anda sebagai data scientist jauh lebih mudah. Anda dapat membaca daftar lengkapnya dengan mengetik ?preProcess dan membaca halaman bantuan untuk fungsi ini.

Satu set fungsi prapemrosesan yang sangat berguna untuk memfitting model regresi adalah standardisasi: centering dan scaling. Pertama, Anda melakukan centering dengan mengurangkan mean setiap kolom dari setiap nilai pada kolom tersebut, lalu Anda melakukan scaling dengan membagi dengan simpangan baku.

Standardisasi mentransformasi data Anda sehingga untuk setiap kolom, mean bernilai 0 dan simpangan baku bernilai 1. Hal ini memudahkan model regresi menemukan solusi yang baik.

Latihan ini adalah bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit glm with median imputation
model <- train(
  x = ___, 
  y = ___,
  method = ___,
  trControl = myControl,
  preProcess = ___
)

# Print model
Edit dan Jalankan Kode