Calculer la statistique de Wald

Dans l’exercice précédent, vous avez ajusté un modèle avec la variable width et évalué la relation entre la variable explicative et la variable réponse. Dans cet exercice, vous allez évaluer la significativité de la variable width en calculant la statistique de Wald.

Notez également que, dans le récapitulatif du modèle, la statistique de Wald est notée par la lettre z, ce qui signifie que la valeur de la statistique suit une loi normale standard. Rappelez-vous la formule de la statistique de Wald :

$$ z=\frac{\hat\beta}{SE} $$

où $\hat\beta$ est le coefficient estimé et $SE$ son erreur standard.

Le modèle ajusté crab_GLM et le jeu de données crab ont été préchargés dans l’espace de travail.

Cet exercice fait partie du cours

<cours>Modèles linéaires généralisés en Python</cours>

Voir le cours

Instructions de l’exercice

En utilisant .params, extrayez et affichez les coefficients du modèle et enregistrez-les comme intercept et slope.
Enregistrez et affichez la matrice de covariance sous le nom crab_cov.
Calculez et affichez l’erreur standard std_error en extrayant l’élément pertinent de la matrice de covariance.
Calculez et affichez la statistique de Wald.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Extract coefficients
intercept, slope = ____.____

# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)

# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))

# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))

Modifier et exécuter le code