1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Các đặc trưng có thông tin tương hỗ

Data frame credit_df chứa một số đặc trưng liên tục. Khi hai đặc trưng liên tục có tương quan, chúng mang cùng một thông tin — được gọi là thông tin tương hỗ (mutual information). Các đặc trưng tương quan cao không chỉ là dư thừa; chúng còn có thể gây ra vấn đề khi xây dựng mô hình. Chẳng hạn, trong hồi quy, các đặc trưng tương quan cao (tức đa cộng tuyến) có thể dẫn đến kết quả vô nghĩa. Để hình dung thông tin tương hỗ, bạn sẽ tạo một biểu đồ tương quan để xác định các đặc trưng có thông tin tương hỗ.

Các gói tidyverse và corrr đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Dùng correlate() và rplot() để tạo biểu đồ tương quan cho các đặc trưng số của credit_df.