1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uogólnione modele liniowe w R

Connected

ćwiczenie

Paradoks Simpsona

Paradoks Simpsona występuje wtedy, gdy dodanie lub usunięcie współczynnika zmienia wyniki analizy – ma to szczególne znaczenie w przypadku regresji. Ilustruje to przykład danych o przyjęciach na studia magisterskie z UC-Berkeley z 1973 roku. Na pierwszy rzut oka kobiety wydają się mieć mniejszą szansę na przyjęcie na studia magisterskie. Jednak po dodaniu zmiennej Department jako współczynnika istotność płci znika. Okazuje się bowiem, że kandydatki ubiegały się o przyjęcie na bardziej konkurencyjne kierunki niż kandydaci.

Uwaga dotycząca danych: Zbiór danych zawiera cztery kolumny: Dept, Gender, Admitted i Rejected. Model glm() z rodziną "binomial" można zbudować, łącząc kolumny Admitted i Rejected.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zbuduj regresję logistyczną za pomocą glm(), w której cbind(Admitted, Rejected) jest przewidywane przez Gender na podstawie ramki danych UCB_data. Zapisz wynik jako glm_1.