Wald-Statistik berechnen

In der vorherigen Übung hast du ein Modell mit der Variablen width fitten und den Zusammenhang zwischen erklärender und Zielvariable beurteilen können. In dieser Übung bewertest du die Signifikanz der Variable width, indem du die Wald-Statistik berechnest.

Beachte außerdem: In der Modellzusammenfassung wird die Wald-Statistik mit dem Buchstaben z dargestellt. Das bedeutet, dass der Wert der Statistik einer Standardnormalverteilung folgt. Erinnern wir uns an die Formel für die Wald-Statistik:

$$ z=\frac{\hat\beta}{SE} $$

wobei $\hat\beta$ der geschätzte Koeffizient und $SE$ sein Standardfehler ist.

Das gefittete Modell crab_GLM und der Datensatz crab sind bereits im Arbeitsbereich geladen.

Diese Übung ist Teil des Kurses

Generalisierte lineare Modelle in Python

Kurs anzeigen

Anleitung zur Übung

Extrahiere mit .params die Modellkoeffizienten, gib sie aus und speichere sie als intercept und slope.
Speichere die Kovarianzmatrix als crab_cov und gib sie aus.
Berechne und gib den Standardfehler std_error aus, indem du das relevante Element aus der Kovarianzmatrix extrahierst.
Berechne und gib die Wald-Statistik aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract coefficients
intercept, slope = ____.____

# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)

# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))

# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))

Code bearbeiten und ausführen