Paradoxo de Simpson
O paradoxo de Simpson ocorre quando adicionar ou remover um coeficiente muda os resultados da análise, e isso é importante em regressões.
Os dados de admissão na pós-graduação de 1973 Graduate School admission data da UC-Berkeley ilustram esse ponto.
À primeira vista, parece que mulheres têm menos chance de serem admitidas em programas de pós-graduação.
No entanto, incluir Department como coeficiente faz com que a significância de gênero desapareça.
Acontece que as candidatas se inscreveram em programas mais competitivos do que os candidatos.
Observação sobre os dados: Ao analisar os dados, você tem quatro colunas: Dept, Gender, Admitted e Rejected. Você pode construir um glm() "binomial" vinculando (binding) as colunas Admitted e Rejected.
Este exercício faz parte do curso
Modelos Lineares Generalizados em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a binomial glm where Admitted and Rejected are predicted by Gender
glm_1 <- ___