1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Înțelegerea componentelor principale

Analiza componentelor principale (PCA) reduce dimensionalitatea prin combinarea informațiilor din caracteristici care nu se suprapun. PCA extrage noi caracteristici numite componente principale, care sunt independente unele față de altele. O modalitate bună de a înțelege PCA este să reprezentăm grafic primele componente principale pe axele x și y și să afișăm vectorii caracteristicilor. Astfel poți vedea ce caracteristici contribuie la fiecare componentă principală. Deși nu este întotdeauna simplu, este o practică bună să denumești componentele principale în funcție de caracteristicile care le influențează. Ca metodă de extragere a caracteristicilor, PCA poate fi însă dificil de interpretat.

Un subset al datelor de credit se află în credit_df. Variabila țintă este credit_score. Pachetele tidyverse și ggfortify au fost deja încărcate pentru tine.

Instrucțiuni

100 XP
  • Efectuează analiza componentelor principale pe credit_df.
  • Folosește autoplot() pentru a afișa primele două componente principale, vectorii și etichetele caracteristicilor, și codifică credit_score prin culoare.