1. Learn
  2. /
  3. Courses
  4. /
  5. Mô hình hóa với tidymodels trong R

Connected

Exercise

Khám phá các biến dự báo có tương quan

Các biến dự báo tương quan cung cấp thông tin trùng lặp và có thể ảnh hưởng tiêu cực đến quá trình fit mô hình. Khi hai biến tương quan cao, giá trị của chúng thay đổi tuyến tính với nhau và vì thế mang cùng một thông tin cho các thuật toán Machine Learning. Hiện tượng này được gọi là đa cộng tuyến (multicollinearity).

Trước khi bắt đầu fit mô hình, việc khám phá dữ liệu để tìm ra các mối quan hệ này và loại bỏ chúng trong bước feature engineering là rất quan trọng.

Trong bài tập này, bạn sẽ khám phá bộ dữ liệu telecom_training bằng cách tạo ma trận tương quan cho tất cả các biến dự báo dạng số.

Dữ liệu telecom_training đã được nạp vào phiên làm việc của bạn.

Instructions 1/3

undefined XP
    1
    2
    3
  • Chọn tất cả các cột dạng số trong dữ liệu telecom_training.
  • Tạo ma trận tương quan cho các cột dạng số của telecom_training.