Statistique du test de la moyenne à deux échantillons
Le test d'hypothèse visant à déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des scores z que vous avez vus au chapitre 1. Il s'appelle « t » et peut être calculé à partir de trois valeurs de chaque échantillon à l'aide de l'équation suivante.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
En essayant de déterminer la raison pour laquelle certains envois sont en retard, vous pouvez vous demander si le poids des envois qui étaient à l'heure est inférieur au poids des envois qui étaient en retard. L'ensemble de données late_shipments
a été divisé en un groupe « oui » (late == "Yes"
) et un groupe « non » (late == "No"
). Le poids de l'envoi est indiqué dans la variable weight_kilograms
.
Les moyennes de l'échantillon pour les deux groupes sont disponibles sous xbar_no
et xbar_yes
. Les écarts types de l'échantillon sont s_no
et s_yes
. Les tailles d'échantillon sont n_no
et n_yes
. numpy
est également chargé en tant que np
.
Cet exercice fait partie du cours
Tests d'hypothèses en Python
Instructions
- Calculez le numérateur de la statistique du test \(t\).
- Calculez le dénominateur de la statistique du test \(t\).
- Utilisez ces deux nombres pour calculer la statistique du test \(t\).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the numerator of the test statistic
numerator = ____
# Calculate the denominator of the test statistic
denominator = ____
# Calculate the test statistic
t_stat = ____
# Print the test statistic
print(t_stat)