Calculer la statistique de Wald
Dans l’exercice précédent, vous avez ajusté un modèle avec la variable width et évalué la relation entre la variable explicative et la variable réponse. Dans cet exercice, vous allez évaluer la significativité de la variable width en calculant la statistique de Wald.
Notez également que, dans le récapitulatif du modèle, la statistique de Wald est notée par la lettre z, ce qui signifie que la valeur de la statistique suit une loi normale standard. Rappelez-vous la formule de la statistique de Wald :
$$ z=\frac{\hat\beta}{SE} $$
où \(\hat\beta\) est le coefficient estimé et \(SE\) son erreur standard.
Le modèle ajusté crab_GLM et le jeu de données crab ont été préchargés dans l’espace de travail.
Cet exercice fait partie du cours
Modèles linéaires généralisés en Python
Instructions
- En utilisant
.params, extrayez et affichez les coefficients du modèle et enregistrez-les comme intercept et slope. - Enregistrez et affichez la matrice de covariance sous le nom
crab_cov. - Calculez et affichez l’erreur standard
std_erroren extrayant l’élément pertinent de la matrice de covariance. - Calculez et affichez la statistique de Wald.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract coefficients
intercept, slope = ____.____
# Estimated covariance matrix: crab_cov
____ = crab_GLM.____
print(____)
# Compute standard error (SE): std_error
____ = np.____(____.loc['width', 'width'])
print('SE: ', round(____, 4))
# Compute Wald statistic
wald_stat = ____/____
print('Wald statistic: ', round(____,4))