Multivariable logistische Regression fitten
Mit dem Wissen aus dem Video kehrst du zum crab-Datensatz zurück und passt ein multivariates logistisches Regressionsmodell an. In Kapitel 2 hast du eine logistische Regression mit width als erklärender Variable geschätzt. In dieser Übung analysierst du die Effekte, wenn color als zusätzliche Variable hinzukommt.
Die Variable color hat eine natürliche Reihenfolge von medium light, medium, medium dark bis dark. Damit ist color eine ordinale Variable, die du in diesem Beispiel als quantitative Variable behandelst.
Der crab-Datensatz ist im Workspace vorab geladen. Beachte außerdem: Der einzige Unterschied zum univariaten Fall liegt im formula-Argument, in dem du jetzt Struktur hinzufügst, um die neue Variable zu berücksichtigen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Importiere die benötigten Funktionen aus der
statsmodels-Bibliothek für GLMs. - Definiere das
formula-Argument, wobeiwidthundcolorerklärende Variablen undydie Zielvariable sind. - Fitte ein multivariates logistisches Regressionsmodell mit der Funktion
glm(). - Gib die Modellergebnisse aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import statsmodels
import ____.____ as sm
from ____.____.____ import glm
# Define model formula
formula = '____ ~ ____'
# Fit GLM
model = glm(____, ____ = ____, ____ = sm.____.____).____
# Print model summary
____(____.____)