1. 학습
  2. /
  3. 강의
  4. /
  5. Học không giám sát với R

Connected

연습 문제

Thực hiện PCA

Bước tiếp theo trong phân tích của bạn là thực hiện PCA trên wisc.data.

Bạn đã thấy ở chương trước rằng cần kiểm tra xem dữ liệu có cần được chuẩn hóa (scale) trước khi chạy PCA hay không. Nhớ lại hai lý do phổ biến để chuẩn hóa dữ liệu:

  1. Các biến đầu vào dùng các đơn vị đo lường khác nhau.
  2. Các biến đầu vào có phương sai khác biệt đáng kể.

지침

100 XP

Các biến bạn đã tạo trước đó, wisc.data và diagnosis, vẫn có sẵn trong không gian làm việc của bạn.

  • Kiểm tra giá trị trung bình và độ lệch chuẩn của các đặc trưng trong dữ liệu để quyết định có nên chuẩn hóa hay không. Dùng các hàm colMeans() và apply() như bạn đã làm trước đó.
  • Thực hiện PCA trên wisc.data, chuẩn hóa nếu phù hợp, và gán mô hình vào wisc.pr.
  • Xem tóm tắt kết quả bằng hàm summary().