1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với caret trong R

Connected

Bài tập

Dùng PCA như một lựa chọn thay thế cho nearZeroVar()

Một cách thay thế việc loại bỏ các biến dự báo có phương sai thấp là chạy PCA trên bộ dữ liệu. Cách này đôi khi tốt hơn vì không loại bỏ toàn bộ dữ liệu: nhiều biến dự báo có phương sai thấp khác nhau có thể được gộp thành một biến PCA có phương sai cao, từ đó có thể cải thiện độ chính xác của mô hình.

Mẹo này đặc biệt hiệu quả với các mô hình tuyến tính: tùy chọn pca trong đối số preProcess sẽ chuẩn hóa về trung tâm và tỉ lệ dữ liệu của bạn, gộp các biến có phương sai thấp, và đảm bảo tất cả biến dự báo là trực giao. Điều này tạo ra một bộ dữ liệu lý tưởng cho hồi quy tuyến tính và thường có thể cải thiện độ chính xác của mô hình.

Hướng dẫn

100 XP

bloodbrain_x và bloodbrain_y đã được nạp trong không gian làm việc của bạn.

  • Huấn luyện một mô hình glm trên toàn bộ bộ dữ liệu blood-brain, sử dụng tùy chọn "pca" cho preProcess.
  • In mô hình ra console và quan sát kết quả.