nearZeroVar()'a alternatif olarak PCA kullanma
Düşük varyanslı öngörücüleri kaldırmaya alternatif olarak, veri kümen üzerinde PCA çalıştırabilirsin. Bu bazen daha tercih edilebilir, çünkü tüm verilerini atmaz: birçok farklı düşük varyanslı öngörücü, tek bir yüksek varyanslı PCA değişkeninde birleştirilebilir ve bu da modelinin doğruluğu üzerinde olumlu bir etki yapabilir.
Bu özellikle doğrusal modeller için iyi bir yöntemdir: preProcess argümanındaki pca seçeneği verini merkezler ve ölçekler, düşük varyanslı değişkenleri birleştirir ve tüm öngörücülerin birbirine dik (orthogonal) olmasını sağlar. Bu, doğrusal regresyon modellemesi için ideal bir veri kümesi oluşturur ve çoğu zaman modellerinin doğruluğunu artırabilir.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
bloodbrain_x ve bloodbrain_y çalışma alanında yüklü.
preProcessiçin"pca"seçeneğini kullanarak tam blood-brain veri kümesine birglmmodeli kur.- Modeli konsola yazdır ve sonucu incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit glm model using PCA: model
model <- train(
x = ___,
y = ___,
method = ___,
preProcess = ___
)
# Print model to console