Koeffizienten als Quoten (odds)
Zuvor hast du ein logistisches Regressionsmodell für die Wahrscheinlichkeit angepasst, den Brunnen zu wechseln, gegeben die arsenic-Werte. In dieser Übung siehst du, wie eine weitere Variable distance100 mit der Wechselwahrscheinlichkeit zusammenhängt und wie man die Koeffizienten als Quoten interpretiert.
Denk daran: Das logistische Regressionsmodell arbeitet mit Log-Quoten (log odds). Um herauszufinden, um welchen Faktor sich die Quoten bei einer Einheitserhöhung von x verändern, exponentierst du die Koeffizientenschätzungen. Das nennt man auch Odds Ratio (Quotenverhältnis).
Zur Erinnerung: Quoten sind das Verhältnis aus Eintreten eines Ereignisses zu Nicht-Eintreten. Wenn die Gewinnquote eines Spiels zum Beispiel 1/2 oder 1 zu 2 (1:2) ist, bedeutet das: Auf einen Sieg kommen zwei Niederlagen.
Der Datensatz wells ist im Workspace geladen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Importiere die Bibliothek
statsmodelsund die Funktionglmausstatsmodels.formula.api. Importiere außerdemnumpyalsnp. - Passe mit
glm()ein logistisches Regressionsmodell an, in demswitchdurchdistance100vorhergesagt wird. - Extrahiere die Modellkoeffizienten über
.params. - Berechne den multiplikativen Effekt auf die Quoten mit der Funktion
exp()ausnumpy.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load libraries and functions
import ____.api as sm
from ____.____.api import glm
import ____ as ____
# Fit logistic regression model
model_GLM = ____(formula = ____,
data = ____,
family = ____.____.____).____
# Extract model coefficients
print('Model coefficients: \n', ____.____)
# Compute the multiplicative effect on the odds
print('Odds: \n', np.____(____.____))