1. Aprende
  2. /
  3. Cursos
  4. /
  5. Hồi quy trung cấp với R

Connected

Ejercicio

Thuật toán hồi quy logistic

Hãy đi sâu vào bên trong và tự triển khai một thuật toán hồi quy logistic. Vì hàm glm() của R rất phức tạp, bạn sẽ chỉ triển khai hồi quy logistic đơn giản cho một bộ dữ liệu duy nhất.

Thay vì dùng tổng bình phương làm thước đo, chúng ta sẽ dùng likelihood. Tuy nhiên, log-likelihood ổn định hơn về mặt tính toán, nên ta sẽ dùng nó. Thực ra còn một thay đổi nữa: vì ta muốn tối đa hóa log-likelihood, nhưng optim() mặc định tìm giá trị nhỏ nhất, nên sẽ dễ hơn nếu ta tính log-likelihood âm.

Giá trị log-likelihood cho mỗi quan sát là

Formula for log-likelihood

Chỉ số cần tính là dấu âm của tổng các thành phần log-likelihood này.

Các giá trị biến giải thích (cột time_since_last_purchase của churn) có sẵn dưới tên x_actual. Các giá trị phản hồi (cột has_churned của churn) có sẵn dưới tên y_actual.

Instrucciones 1/3

undefined XP
    1
    2
    3
  • Đặt hệ số chặn bằng một.
  • Đặt hệ số dốc bằng 0.5.
  • Tính các giá trị y dự đoán bằng hệ số chặn cộng hệ số dốc nhân các giá trị x thực tế, rồi biến đổi bằng hàm CDF của phân phối logistic.
  • Tính log-likelihood cho từng phần tử bằng log của y dự đoán nhân với y thực tế, cộng log của một trừ y dự đoán nhân với một trừ y thực tế.
  • Tính giá trị âm của tổng các log-likelihood cho từng phần tử.