Statistique du test de la moyenne à deux échantillons
Le test d'hypothèse visant à déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des scores z que vous avez vus dans le premier chapitre. Elle est appelée "t" et peut être calculée à partir de trois valeurs de chaque échantillon à l'aide de l'équation suivante.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
En essayant de déterminer la raison pour laquelle certaines expéditions sont en retard, vous pouvez vous demander si le poids des expéditions en retard est différent du poids des expéditions qui étaient à l'heure. L'ensemble de données late_shipments
a été divisé en un groupe « oui » (late == "Yes"
) et un groupe « non » (late == "No"
). Le poids de l'envoi est indiqué dans la variable weight_kilograms
.
Pour des raisons de commodité, les moyennes de l'échantillon pour les deux groupes sont disponibles sous les noms xbar_no
et xbar_yes
. Les écarts types de l'échantillon sont s_no
et s_yes
. Les tailles des échantillons sont n_no
et n_yes
.
Cet exercice fait partie du cours
Tests d'hypothèses en R
Instructions
- Calculez le numérateur de la statistique du test.
- Calculez le dénominateur de la statistique de test.
- Utilisez ces deux nombres pour calculer la statistique du test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the numerator of the test statistic
numerator <- ___
# Calculate the denominator of the test statistic
denominator <- ___
# Calculate the test statistic
t_stat <- ___
# See the result
t_stat