Menggunakan PCA sebagai alternatif nearZeroVar()

Alternatif dari menghapus prediktor dengan varians rendah adalah menjalankan PCA pada himpunan data Anda. Ini kadang lebih disukai karena tidak membuang seluruh data Anda: banyak prediktor dengan varians rendah yang berbeda dapat digabungkan menjadi satu variabel PCA dengan varians tinggi, yang mungkin berdampak positif pada akurasi model Anda.

Ini sangat bermanfaat untuk model linear: opsi pca pada argumen preProcess akan melakukan pemusatan dan penskalaan data Anda, menggabungkan variabel ber-varians rendah, serta memastikan semua prediktor saling ortogonal. Ini menghasilkan himpunan data yang ideal untuk pemodelan regresi linear, dan sering kali dapat meningkatkan akurasi model Anda.

Latihan ini merupakan bagian dari kursus

Machine Learning dengan caret di R

Lihat Kursus

Instruksi latihan

bloodbrain_x dan bloodbrain_y telah dimuat di workspace Anda.

Latih model glm pada seluruh himpunan data blood-brain dengan menggunakan opsi "pca" pada preProcess.
Cetak model ke konsol dan periksa hasilnya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Fit glm model using PCA: model
model <- train(
  x = ___, 
  y = ___,
  method = ___, 
  preProcess = ___
)

# Print model to console

Edit dan Jalankan Kode