Wald-statistiek berekenen
In de vorige oefening heb je een model met de variabele width gefit en de relatie tussen de verklarende en responsvariabele beoordeeld. In deze oefening beoordeel je de significantie van de variabele width door de Wald-statistiek te berekenen.
Let ook op dat in de model-samenvatting de Wald-statistiek wordt weergegeven met de letter z, wat betekent dat de waarde van de statistiek een standaardnormale verdeling volgt. Herinner de formule voor de Wald-statistiek:
$$ z=\frac{\hat\beta}{SE} $$
waarbij \(\hat\beta\) de geschatte coëfficiënt is en \(SE\) de standaardfout daarvan.
Het gefitte model crab_GLM en de crab-gegevensset zijn al in de werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Generalized Linear Models in Python
Oefeninstructies
- Gebruik
.paramsom de modelcoëfficiënten te extraheren en af te drukken, en sla ze op als intercept en helling. - Sla de covariantiematrix op als
crab_coven druk die af. - Bereken en print de standaardfout
std_errordoor het relevante element uit de covariantiematrix te halen. - Bereken en print de Wald-statistiek.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extract coefficients
intercept, slope = ____.____
# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)
# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))
# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))