Régression logistique avec données au format large
Les deuxième et troisième approches pour ajuster des régressions logistiques nécessitent des données au format « large » :
x fail success Total successProportion
1 a 12 2 14 0.1428571
2 b 3 11 14 0.7857143
Pour la deuxième approche, on modélise une matrice à 2 colonnes des succès et des échecs (par exemple, le nombre de « non » et de « oui » par groupe).
Dans ce format, utilisez la formule cbind(success, fail) ~ predictor.
Pour la troisième approche, on modélise la probabilité de succès (par exemple, le groupe 1 a 75 % de « oui » et le groupe 2 a 65 % de « non ») ainsi que le poids ou le nombre d’observations par groupe (par exemple, 40 individus dans le groupe 1 et 100 individus dans le groupe 2).
Dans cet exemple, successProportion = success / Total.
Dans ce format, on utilise la formule proportion of successes ~ response variable avec weights = number in treatment.
Cet exercice fait partie du cours
Modèles Linéaires Généralisés (GLM) en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit a wide form logistic regression
lr_2 <- ___
# Print the output of lr_2
___