1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Zrozumienie głównych składowych

Analiza głównych składowych (PCA) redukuje wymiarowość, łącząc informacje z cech, które się nie nakładają. PCA wyodrębnia nowe cechy – tzw. główne składowe – które są od siebie niezależne. Jednym ze sposobów zrozumienia PCA jest wykreślenie najważniejszych składowych wzdłuż osi x i y oraz wyświetlenie wektorów cech. Dzięki temu możesz zobaczyć, które cechy mają wpływ na każdą główną składową. Choć nie zawsze jest to łatwe, dobrą praktyką jest nadawanie głównym składowym nazw na podstawie cech, które je tworzą. Jako metoda ekstrakcji cech PCA bywa jednak trudna w interpretacji.

Podzbiór danych kredytowych znajduje się w credit_df. Zmienna docelowa to credit_score. Pakiety tidyverse i ggfortify zostały już załadowane.

Instrukcje

100 XP
  • Wykonaj analizę głównych składowych na zbiorze credit_df.
  • Użyj autoplot(), aby wyświetlić dwie pierwsze główne składowe, wektory cech wraz z etykietami, i zakoduj credit_score kolorem.