1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Đại số tuyến tính cho Khoa học dữ liệu với R

Connected

Bài tập

Tóm tắt PCA trong R

Như bạn đã thấy trong video, dữ liệu của chúng ta có một biến phân loại (vị trí) dường như trùng với các cụm ở hai thành phần chính đầu tiên. Ngay cả khi chuẩn hóa dữ liệu, hai PC này vẫn giải thích một phần lớn phương sai trong dữ liệu. Vậy nếu ta chỉ xem xét từng vị trí một thì sao?

Hướng dẫn

100 XP

Thực hiện lại phân tích như ở bài tập trước, nhưng chỉ dùng tập con dữ liệu nơi position bằng "WR" (wide receiver):

  • Dùng hàm scale() để chuẩn hóa các cột từ cột thứ 5 đến cột thứ 12 của dữ liệu combine_WR. Đặt tên khung dữ liệu này là B và hiển thị một vài giá trị bằng head().
  • Dùng prcomp() để thực hiện phân tích thành phần chính trên dữ liệu và tóm tắt kết quả bằng summary().