1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học không giám sát với R

Connected

Bài tập

Phần phương sai được giải thích

Trong bài tập này, bạn sẽ tạo biểu đồ scree thể hiện tỷ lệ phương sai được giải thích khi số lượng thành phần chính tăng lên. Dữ liệu từ PCA cần được chuẩn bị trước cho các biểu đồ này vì không có hàm dựng sẵn trong R để tạo trực tiếp từ mô hình PCA.

Khi xem các biểu đồ, hãy tự hỏi liệu có “khuỷu tay” nào trong lượng phương sai được giải thích có thể gợi ý cho bạn một số lượng thành phần chính “tự nhiên” hay không. Nếu không có khuỷu tay rõ ràng — điều thường gặp với dữ liệu thực tế — hãy cân nhắc những cách khác để quyết định số thành phần chính cần giữ lại dựa trên biểu đồ scree.

Hướng dẫn

100 XP

Các biến bạn đã tạo trước đó, wisc.data, diagnosis và wisc.pr, vẫn còn sẵn sàng.

  • Tính phương sai của mỗi thành phần chính bằng cách bình phương thành phần sdev của wisc.pr. Lưu kết quả vào đối tượng tên pr.var.
  • Tính phần phương sai được giải thích bởi mỗi thành phần chính bằng cách chia cho tổng phương sai được giải thích của tất cả các thành phần chính. Gán vào biến tên pve.
  • Tạo biểu đồ phần phương sai được giải thích cho từng thành phần chính.
  • Dùng hàm cumsum(), tạo biểu đồ tỷ lệ phương sai tích lũy được giải thích.