1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Thống kê với R

Connected

Bài tập

PCA - giảm chiều dữ liệu

Ở bài trước, bạn làm việc với một tập dữ liệu có hai biến. Khi phỏng vấn, bạn thường sẽ gặp những tập dữ liệu lớn hơn.

PCA cho phép giảm số lượng biến mà không làm mất đáng kể thông tin.

PCA trả về một tập dữ liệu cùng kích thước với tập dữ liệu gốc. Việc giữ lại bao nhiêu biến là do bạn quyết định!

Các tham số sau của prcomp() giảm số chiều dựa trên:

  • tol - độ lệch chuẩn tính theo phần trăm so với độ lệch chuẩn của thành phần chính thứ nhất,
  • rank - số lượng thành phần chính tối đa.

Tập dữ liệu letters chứa các thuộc tính số của các chữ cái.

Hướng dẫn 1/3

undefined XP
  • 1

    Xác định các thành phần chính và hiển thị tỷ lệ phương sai mà mỗi thành phần giải thích.

  • 2

    Loại bỏ các thành phần có độ lệch chuẩn nhỏ hơn 0.25 lần độ lệch chuẩn của thành phần thứ nhất.

  • 3

    Giới hạn số lượng thành phần chính ở mức 7.