CommencerCommencer gratuitement

Régression logistique avec données au format large

Les deuxième et troisième approches pour ajuster des régressions logistiques nécessitent des données au format « large » :

      x fail success Total successProportion
    1 a   12       2    14         0.1428571
    2 b    3      11    14         0.7857143

Pour la deuxième approche, on modélise une matrice à 2 colonnes des succès et des échecs (par exemple, le nombre de « non » et de « oui » par groupe).

Dans ce format, utilisez la formule cbind(success, fail) ~ predictor.

Pour la troisième approche, on modélise la probabilité de succès (par exemple, le groupe 1 a 75 % de « oui » et le groupe 2 a 65 % de « non ») ainsi que le poids ou le nombre d’observations par groupe (par exemple, 40 individus dans le groupe 1 et 100 individus dans le groupe 2). Dans cet exemple, successProportion = success / Total.

Dans ce format, on utilise la formule proportion of successes ~ response variable avec weights = number in treatment.

Cet exercice fait partie du cours

Modèles Linéaires Généralisés (GLM) en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit a wide form logistic regression
lr_2 <- ___

# Print the output of lr_2
___
Modifier et exécuter le code