Logistische Regression mit Wide-Format-Eingaben
Die zweite und dritte Vorgehensweise zum Fitten logistischer Regressionen benötigen Daten im „Wide“-Format:
x fail success Total successProportion
1 a 12 2 14 0.1428571
2 b 3 11 14 0.7857143
Bei der zweiten Vorgehensweise modellierst du eine 2-Spalten-Matrix aus Erfolgen und Misserfolgen (z. B. Anzahl von Nein- und Ja-Antworten pro Gruppe).
In diesem Format verwendest du die Formel cbind(success, fail) ~ predictor.
Bei der dritten Vorgehensweise modellierst du die Erfolgswahrscheinlichkeit (z. B. Gruppe 1 hatte 75 % Ja und Gruppe 2 hatte 65 % Nein) sowie das Gewicht bzw. die Anzahl der Beobachtungen pro Gruppe (z. B. es gab 40 Personen in Gruppe 1 und 100 Personen in Gruppe 2).
In diesem Beispiel gilt successProportion = success / Total.
In diesem Format wird die Formel proportion of successes ~ response variable mit weights = number in treatment verwendet.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit a wide form logistic regression
lr_2 <- ___
# Print the output of lr_2
___