Der Effekt von Multikollinearität
Mit dem Datensatz crab analysierst du die Auswirkungen von Multikollinearität. Denk daran, dass Multikollinearität folgende Effekte haben kann:
- Der Koeffizient ist nicht signifikant, obwohl die Variable stark mit \(y\) korreliert ist.
- Das Hinzufügen/Entfernen einer Variable ändert die Koeffizienten deutlich.
- Unlogisches Vorzeichen des Koeffizienten.
- Variablen weisen eine hohe paarweise Korrelation auf.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Importiere die nötigen Funktionen aus der
statsmodels-Bibliothek für GLMs. - Fitte ein multivariates logistisches Regressionsmodell mit
weightundwidthals erklärenden Variablen undyals Zielvariable. - Gib die Modellergebnisse mit der Funktion
print()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)