1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Hồi quy trung cấp với R

Connected

Bài tập

Thuật toán hồi quy tuyến tính

Để thật sự hiểu hồi quy tuyến tính, sẽ hữu ích nếu bạn biết thuật toán vận hành thế nào. Mã nguồn của lm() dài hàng trăm dòng vì nó phải hoạt động với mọi công thức và mọi tập dữ liệu. Tuy nhiên, với hồi quy tuyến tính đơn giản cho một tập dữ liệu cụ thể, bạn có thể tự triển khai thuật toán hồi quy tuyến tính chỉ trong vài dòng mã.

Quy trình gồm:

  1. Viết một script để tính tổng bình phương sai số (sum of squares).
  2. Chuyển nó thành một hàm.
  3. Dùng hàm tối ưu hóa mục đích chung của R để tìm các hệ số làm nhỏ nhất đại lượng này.

Các giá trị biến giải thích (cột n_convenience của taiwan_real_estate) đã có dưới tên x_actual. Các giá trị biến phản hồi (cột price_twd_msq của taiwan_real_estate) đã có dưới tên y_actual.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Đặt intercept bằng mười.
  • Đặt slope bằng một.
  • Tính các giá trị y dự đoán bằng intercept cộng slope nhân với các giá trị x thực tế.
  • Tính các chênh lệch giữa y thực tế và y dự đoán.
  • Tính tổng bình phương sai số: lấy tổng các chênh lệch của y và bình phương từng giá trị.