1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování statistických otázek k pohovoru v R

Connected

Cvičení

PCA – redukce dimenzí

V předchozím cvičení jsi pracoval/a s datasetem obsahujícím dvě proměnné. Při pohovoru se ale pravděpodobně setkáš s větším datasetem.

PCA umožňuje snížit počet proměnných bez výrazné ztráty informační hodnoty.

PCA vrací dataset stejné velikosti jako původní dataset. Jen na tobě záleží, kolik proměnných si ponecháš!

Následující parametry funkce prcomp() redukují dimenze na základě:

  • tol – směrodatná odchylka jako procento směrodatné odchylky první komponenty,
  • rank – maximální počet komponent.

Dataset letters obsahuje numerické atributy písmen.

Pokyny 1/3

undefined XP
  • 1

    Identifikuj hlavní komponenty a zobraz podíl rozptylu zachyceného každou z nich.

  • 2

    Vynech komponenty, jejichž směrodatná odchylka je nižší než 0,25 směrodatné odchylky první komponenty.

  • 3

    Omezte počet hlavních komponent na 7.