1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học không giám sát với R

Connected

Bài tập

Vấn đề thực tiễn: chuẩn hóa (scaling)

Bạn đã thấy trong video rằng việc chuẩn hóa dữ liệu trước khi thực hiện PCA sẽ làm thay đổi kết quả mô hình PCA. Ở đây, bạn sẽ chạy PCA có và không chuẩn hóa, rồi trực quan hóa kết quả bằng biplot.

Đôi khi việc chuẩn hóa là phù hợp khi phương sai của các biến khác nhau đáng kể. Điều này thường xảy ra khi các biến có đơn vị đo lường khác nhau, ví dụ độ F (nhiệt độ) và dặm (khoảng cách). Quyết định có nên chuẩn hóa hay không là một bước quan trọng khi thực hiện phân tích thành phần chính.

Hướng dẫn

100 XP

Cùng bộ dữ liệu Pokemon có sẵn trong không gian làm việc của bạn là pokemon, nhưng đã thêm một biến mới: Total.

  • Có sẵn một đoạn mã ở đầu trình soạn thảo để tính trung bình và độ lệch chuẩn của từng biến trong mô hình. Chạy đoạn mã này để xem thang đo của các biến khác nhau như thế nào trong dữ liệu gốc.
  • Tạo một mô hình PCA trên pokemon có chuẩn hóa, gán kết quả vào pr.with.scaling.
  • Tạo một mô hình PCA trên pokemon không chuẩn hóa, gán kết quả vào pr.without.scaling.
  • Dùng biplot() để vẽ cả hai mô hình (lần lượt từng mô hình) và so sánh đầu ra của chúng.