Wald-Statistik berechnen
In der vorherigen Übung hast du ein Modell mit der Variablen width fitten und den Zusammenhang zwischen erklärender und Zielvariable beurteilen können. In dieser Übung bewertest du die Signifikanz der Variable width, indem du die Wald-Statistik berechnest.
Beachte außerdem: In der Modellzusammenfassung wird die Wald-Statistik mit dem Buchstaben z dargestellt. Das bedeutet, dass der Wert der Statistik einer Standardnormalverteilung folgt. Erinnern wir uns an die Formel für die Wald-Statistik:
$$ z=\frac{\hat\beta}{SE} $$
wobei \(\hat\beta\) der geschätzte Koeffizient und \(SE\) sein Standardfehler ist.
Das gefittete Modell crab_GLM und der Datensatz crab sind bereits im Arbeitsbereich geladen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Extrahiere mit
.paramsdie Modellkoeffizienten, gib sie aus und speichere sie als intercept und slope. - Speichere die Kovarianzmatrix als
crab_covund gib sie aus. - Berechne und gib den Standardfehler
std_erroraus, indem du das relevante Element aus der Kovarianzmatrix extrahierst. - Berechne und gib die Wald-Statistik aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract coefficients
intercept, slope = ____.____
# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)
# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))
# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))