1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

PCA trong tidymodels

Từ góc độ xây dựng mô hình, PCA cho phép bạn tạo các mô hình với ít đặc trưng hơn nhưng vẫn nắm bắt phần lớn thông tin trong dữ liệu gốc. Tuy nhiên, như bạn đã thấy, một nhược điểm của PCA là khó diễn giải mô hình. Trong bài tập này, bạn sẽ tập trung xây dựng một mô hình hồi quy tuyến tính trên một tập con dữ liệu bán nhà. Biến mục tiêu là price.

Một mô hình xây trực tiếp từ dữ liệu mà không trích xuất các thành phần chính có RMSE là $236,461.4. Bạn sẽ áp dụng PCA với tidymodels và so sánh RMSE mới. Hãy nhớ, RMSE càng thấp càng tốt.

Các gói tidyverse và tidymodels đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Xây dựng một recipe PCA dùng train để trích xuất năm thành phần chính.
  • Fit một workflow với đặc tả mô hình mặc định linear_reg().
  • Tạo một data frame dự đoán trên tập test bao gồm cả giá trị thực tế và giá trị dự đoán.
  • Tính RMSE cho mô hình hồi quy tuyến tính sau khi giảm chiều bằng PCA.