1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Phân tách giá nhà bằng PCA

PCA và t-SNE đều là kỹ thuật trích xuất đặc trưng, nhưng PCA chỉ nắm bắt được cấu trúc tuyến tính của dữ liệu. Trong bài này, bạn sẽ tạo một biểu đồ PCA cho toàn bộ house_sales_df để so sánh kết quả của nó với đầu ra t-SNE.

Hãy nhớ rằng price là biến mục tiêu trong house_sales_df. Cần loại bỏ biến này trước khi fit PCA vào dữ liệu.

Các gói tidyverse và ggfortify đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Fit PCA cho các biến dự báo của house_sales_df.
  • Dùng autoplot() để vẽ hai thành phần chính đầu tiên và mã hóa giá bằng màu.