1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z caret w R

Connected

ćwiczenie

Użycie PCA jako alternatywy dla nearZeroVar()

Alternatywą dla usuwania predyktorów o niskiej wariancji jest zastosowanie PCA na zbiorze danych. Takie podejście bywa lepszym wyborem, ponieważ nie odrzuca wszystkich danych: wiele predyktorów o niskiej wariancji może zostać połączonych w jedną zmienną PCA o wysokiej wariancji, co może pozytywnie wpłynąć na dokładność modelu.

To szczególnie przydatna technika w przypadku modeli liniowych: opcja pca w argumencie preProcess wycentruje i przeskaluje dane, połączy zmienne o niskiej wariancji oraz zagwarantuje, że wszystkie predyktory będą ortogonalne. Dzięki temu powstaje idealny zbiór danych do regresji liniowej, który często poprawia dokładność modeli.

Instrukcje

100 XP

bloodbrain_x i bloodbrain_y są wczytane do twojego środowiska pracy.

  • Dopasuj model glm do pełnego zbioru danych blood-brain, używając opcji "pca" w argumencie preProcess.
  • Wyświetl model w konsoli i przejrzyj wyniki.