Logistische Regressionsausgaben vergleichen
Beim Erstellen von Modellen solltest du mehr Beobachtungen haben als Parameter, die im Modell geschätzt werden. Diese zusätzlichen Freiheitsgrade heißen auf Englisch degrees of freedom.
Ein Modell mit zu wenigen Beobachtungen kann overfit sein oder sogar nicht schätzbar (manchmal singular genannt). Außerdem hilft der Blick auf die Freiheitsgrade dabei, deine Daten und deinen Code zu prüfen. Wenn zum Beispiel die Freiheitsgrade nicht zu der Anzahl an Beobachtungen passen, die du erwartest, kann das darauf hindeuten, dass deine Daten noch bereinigt werden müssen, ein Bug im Code steckt oder ein Modellierungsfehler vorliegt.
Die Wide- gegenüber der Long-Eingabe für glm() führt zu unterschiedlichen Freiheitsgraden, weil sich durch die unterschiedliche Zeilenzahl der Eindruck einer unterschiedlichen Anzahl an Beobachtungen ergibt.
In den vorherigen Übungen hast du eine logistische Regression mit drei verschiedenen Eingabeoptionen gefittet.
Diese wurden als lr_1, lr_2 und lr_3 für dich geladen.
Sieh dir die Zusammenfassungen dieser drei Modelle an.
Wie unterscheiden sich die Freiheitsgrade zwischen den Modellen?
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in R
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten