1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Použití PCA jako alternativy k nearZeroVar()

Alternativou k odstraňování prediktorů s nízkou variancí je spustit na svých datech PCA. Tento přístup je někdy výhodnější, protože nepřichází o všechna data: mnoho různých prediktorů s nízkou variancí může být sloučeno do jediné PCA proměnné s vysokou variancí, což může mít pozitivní vliv na přesnost modelu.

Obzvlášť užitečný je tento trik u lineárních modelů: možnost pca v argumentu preProcess data vycentruje a škáluje, sloučí proměnné s nízkou variancí a zajistí, že všechny prediktory budou ortogonální. Výsledkem je ideální dataset pro lineární regresní modelování, který dokáže přesnost modelů výrazně zlepšit.

Pokyny

100 XP

bloodbrain_x a bloodbrain_y jsou načteny v tvém pracovním prostředí.

  • Natrénuj model glm na celém datasetu blood-brain s použitím možnosti "pca" v argumentu preProcess.
  • Vypiš model do konzole a prohlédni si výsledek.