1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning cho Phân tích Marketing bằng R

Connected

Bài tập

Hồi quy tuyến tính với các thành phần chính

Đối tượng newsData hiện có thêm một biến: logShares. Số lần chia sẻ cho biết bài báo được chia sẻ bao nhiêu lần. Tuy nhiên, phân phối này sẽ bị lệch mạnh, nên bạn sẽ làm việc với log của số lần chia sẻ. Hãy áp dụng những gì bạn vừa học để dự đoán log shares!

Hướng dẫn

100 XP
  • Xây dựng một mô hình dự đoán log shares bằng tất cả các biến còn lại. Lưu mô hình là mod1.
  • Tạo dataframe mới dataNewsComponents gồm log shares và các giá trị trên 6 thành phần đầu tiên. Đối tượng pcaNews tiếp tục chứa kết quả PCA.
  • Xây dựng mô hình thứ hai (mod2) dự đoán log shares chỉ với 6 thành phần.
  • So sánh R bình phương hiệu chỉnh của các mô hình. Khi chỉ dùng các thành phần chính, giá trị thay đổi thế nào? Mô hình của bạn tốt đến mức nào?