Statistique de test pour deux moyennes
Le test d'hypothèse visant à déterminer s'il existe une différence entre les moyennes de deux populations utilise un type de statistique de test différent des z-scores vus au chapitre 1. Il s'agit de « t », qui peut être calculée à partir de trois valeurs pour chaque échantillon selon l'équation suivante.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
En cherchant à comprendre pourquoi certaines expéditions arrivent en retard, vous pouvez vous demander si le poids des envois en retard diffère de celui des envois arrivés à l'heure. Le jeu de données late_shipments a été scindé en un groupe « yes », où late == "Yes", et un groupe « no », où late == "No". Le poids de l'envoi est indiqué dans la variable weight_kilograms.
Pour vous faciliter la tâche, les moyennes d'échantillon des deux groupes sont disponibles sous xbar_no et xbar_yes. Les écarts types d'échantillon sont s_no et s_yes. Les tailles d'échantillon sont n_no et n_yes.
Cet exercice fait partie du cours
Tests d’hypothèses en R
Instructions
- Calculez le numérateur de la statistique de test.
- Calculez le dénominateur de la statistique de test.
- Utilisez ces deux valeurs pour calculer la statistique de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the numerator of the test statistic
numerator <- ___
# Calculate the denominator of the test statistic
denominator <- ___
# Calculate the test statistic
t_stat <- ___
# See the result
t_stat