1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Phân tích Marketing bằng R

Connected

Bài tập

Tránh đa cộng tuyến

Quay lại bộ dữ liệu bán hàng salesData đã được nạp sẵn trong môi trường làm việc. Ngoài ra, gói rms cũng đã được nạp.

Hãy ước lượng một mô hình hồi quy tuyến tính bội! Tất nhiên, bạn muốn tận dụng tất cả các biến có trong bộ dữ liệu.

Hướng dẫn

100 XP
  • Hãy tính một mô hình đầy đủ đặt tên là salesModel1 dùng tất cả các biến trừ id để giải thích doanh số trong tháng này. Để làm điều này, điền đúng tên biến vào cú pháp mẫu sau: response ~ . - excluded_variable. Có thể hiểu là "response được mô hình hóa bởi tất cả các biến ngoại trừ excluded_variable."
  • Ước lượng hệ số phóng đại phương sai bằng hàm vif() từ gói rms.
  • Bên cạnh việc loại biến id, hãy loại thêm các biến preferredBrand và nBrands để tránh đa cộng tuyến. Bạn làm điều này bằng cách nối từng biến với -. Lưu mô hình vào đối tượng salesModel2.
  • Ước lượng lại các hệ số phóng đại phương sai của mô hình. Bây giờ bạn có chấp nhận kết quả không?