1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Tìm hiểu về các thành phần chính

Phân tích thành phần chính (PCA) giúp giảm chiều dữ liệu bằng cách kết hợp thông tin đặc trưng không chồng lặp. PCA trích xuất các đặc trưng mới gọi là các thành phần chính, độc lập với nhau. Một cách để hiểu PCA là vẽ các thành phần chính quan trọng trên trục x và y, đồng thời hiển thị các vector đặc trưng. Cách này cho bạn thấy những đặc trưng nào đang đóng góp vào từng thành phần chính. Dù không phải lúc nào cũng dễ, thực hành tốt là đặt tên cho các thành phần chính dựa trên các đặc trưng đóng góp cho chúng. Tuy nhiên, với vai trò là một phương pháp trích xuất đặc trưng, PCA thường khó diễn giải.

Một tập con của dữ liệu tín dụng nằm trong credit_df. Biến đích là credit_score. Các gói tidyverse và ggfortify cũng đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Thực hiện phân tích thành phần chính trên credit_df.
  • Dùng autoplot() để hiển thị hai thành phần chính đầu tiên, các vector và nhãn đặc trưng, và mã hóa credit_score bằng màu sắc.