1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Generalized Linear Models in R

Connected

Bài tập

Nghịch lý Simpson

Nghịch lý Simpson xảy ra khi việc thêm hoặc bớt một hệ số làm thay đổi kết quả phân tích, và điều này rất quan trọng trong hồi quy. Bộ dữ liệu tuyển sinh sau đại học năm 1973 của UC-Berkeley minh họa rõ điều này. Thoạt nhìn, có vẻ nữ giới ít có khả năng được nhận vào các chương trình sau đại học hơn. Tuy nhiên, khi thêm Department như một hệ số, ý nghĩa thống kê của giới tính biến mất. Hóa ra, các ứng viên nữ có xu hướng nộp vào những chương trình cạnh tranh hơn nam giới.

Ghi chú dữ liệu: Khi xem dữ liệu, bạn có bốn cột: Dept, Gender, Admitted và Rejected. Bạn có thể xây dựng một glm() "nhị thức" bằng cách gộp hai cột Admitted và Rejected.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Xây dựng hồi quy logistic bằng glm() với cbind(Admitted, Rejected) được dự báo bởi Gender sử dụng data frame UCB_data. Lưu lại dưới tên glm_1.