BaşlayınÜcretsiz Başlayın

nearZeroVar()'a alternatif olarak PCA kullanma

Düşük varyanslı öngörücüleri kaldırmaya alternatif olarak, veri kümen üzerinde PCA çalıştırabilirsin. Bu bazen daha tercih edilebilir, çünkü tüm verilerini atmaz: birçok farklı düşük varyanslı öngörücü, tek bir yüksek varyanslı PCA değişkeninde birleştirilebilir ve bu da modelinin doğruluğu üzerinde olumlu bir etki yapabilir.

Bu özellikle doğrusal modeller için iyi bir yöntemdir: preProcess argümanındaki pca seçeneği verini merkezler ve ölçekler, düşük varyanslı değişkenleri birleştirir ve tüm öngörücülerin birbirine dik (orthogonal) olmasını sağlar. Bu, doğrusal regresyon modellemesi için ideal bir veri kümesi oluşturur ve çoğu zaman modellerinin doğruluğunu artırabilir.

Bu egzersiz

R ile caret kullanarak Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

bloodbrain_x ve bloodbrain_y çalışma alanında yüklü.

  • preProcess için "pca" seçeneğini kullanarak tam blood-brain veri kümesine bir glm modeli kur.
  • Modeli konsola yazdır ve sonucu incele.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Fit glm model using PCA: model
model <- train(
  x = ___, 
  y = ___,
  method = ___, 
  preProcess = ___
)

# Print model to console
Kodu Düzenle ve Çalıştır