Wald-statistiek berekenen

In de vorige oefening heb je een model met de variabele width gefit en de relatie tussen de verklarende en responsvariabele beoordeeld. In deze oefening beoordeel je de significantie van de variabele width door de Wald-statistiek te berekenen.

Let ook op dat in de model-samenvatting de Wald-statistiek wordt weergegeven met de letter z, wat betekent dat de waarde van de statistiek een standaardnormale verdeling volgt. Herinner de formule voor de Wald-statistiek:

$$ z=\frac{\hat\beta}{SE} $$

waarbij $\hat\beta$ de geschatte coëfficiënt is en $SE$ de standaardfout daarvan.

Het gefitte model crab_GLM en de crab-gegevensset zijn al in de werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Generalized Linear Models in Python

Cursus bekijken

Oefeninstructies

Gebruik .params om de modelcoëfficiënten te extraheren en af te drukken, en sla ze op als intercept en helling.
Sla de covariantiematrix op als crab_cov en druk die af.
Bereken en print de standaardfout std_error door het relevante element uit de covariantiematrix te halen.
Bereken en print de Wald-statistiek.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract coefficients
intercept, slope = ____.____

# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)

# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))

# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))

Code bewerken en uitvoeren