BaşlayınÜcretsiz başlayın

nearZeroVar()'a alternatif olarak PCA kullanma

Düşük varyanslı öngörücüleri kaldırmaya alternatif olarak, veri kümen üzerinde PCA çalıştırabilirsin. Bu bazen daha tercih edilebilir, çünkü tüm verilerini atmaz: birçok farklı düşük varyanslı öngörücü, tek bir yüksek varyanslı PCA değişkeninde birleştirilebilir ve bu da modelinin doğruluğu üzerinde olumlu bir etki yapabilir.

Bu özellikle doğrusal modeller için iyi bir yöntemdir: preProcess argümanındaki pca seçeneği verini merkezler ve ölçekler, düşük varyanslı değişkenleri birleştirir ve tüm öngörücülerin birbirine dik (orthogonal) olmasını sağlar. Bu, doğrusal regresyon modellemesi için ideal bir veri kümesi oluşturur ve çoğu zaman modellerinin doğruluğunu artırabilir.

Bu egzersiz, kursun bir parçasıdır

R ile caret kullanarak Machine Learning

Kursa Göz Atın

Egzersiz talimatları

bloodbrain_x ve bloodbrain_y çalışma alanında yüklü.

  • preProcess için "pca" seçeneğini kullanarak tam blood-brain veri kümesine bir glm modeli kur.
  • Modeli konsola yazdır ve sonucu incele.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Fit glm model using PCA: model
model <- train(
  x = ___, 
  y = ___,
  method = ___, 
  preProcess = ___
)

# Print model to console
Kodu Düzenle ve Çalıştır