1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Porozumění hlavním komponentám

Analýza hlavních komponent (PCA) snižuje dimenzionalitu tím, že kombinuje nepřekrývající se informace z jednotlivých příznaků. PCA extrahuje nové příznaky zvané hlavní komponenty, které jsou na sobě navzájem nezávislé. Jedním ze způsobů, jak PCA pochopit, je vynést první dvě hlavní komponenty na osy x a y a zobrazit vektory příznaků. Díky tomu vidíš, které příznaky přispívají ke každé hlavní komponentě. I když to není vždy jednoduché, je dobrou praxí pojmenovat hlavní komponenty podle příznaků, které je tvoří. PCA je ale jako metoda extrakce příznaků často obtížně interpretovatelná.

Podmnožina kreditních dat je uložena v credit_df. Cílová proměnná je credit_score. Balíčky tidyverse a ggfortify jsou již načtené.

Pokyny

100 XP
  • Proveď analýzu hlavních komponent na datasetu credit_df.
  • Pomocí autoplot() zobraz první dvě hlavní komponenty, vektory příznaků s popisky a zakóduj credit_score barvou.